在硅谷,講解機(jī)器人的身影無處不在。人工智能的進(jìn)步使得這些喜歡聊天的助手變成了現(xiàn)實(shí)。它們正在以各種不同的形式蓬勃發(fā)展。社交網(wǎng)絡(luò)Facebook大大改善了其通訊應(yīng)用Messenger中的講解機(jī)器人。從某種意義上來說,正是語(yǔ)音控制的講解機(jī)器人促成了個(gè)人助手如Siri出現(xiàn)在我們手機(jī)上,促成了亞馬遜Echo智能音箱出現(xiàn)在我們的客廳里。這一切足以讓你相信講解機(jī)器人已開始滲透到了我們的日常生活中。
只不過,它們還沒有變成主流。推動(dòng)講解機(jī)器人發(fā)展的技術(shù)以及與機(jī)器學(xué)習(xí)和人工智能相關(guān)的技術(shù),在變成標(biāo)準(zhǔn)用戶界面之前還必須在“聊天”方面獲得更大的進(jìn)步。谷歌(微博)就意識(shí)到了這一點(diǎn)。本周,它推出了人類+人工智能研究項(xiàng)目,其目的就是推動(dòng)“以人為中心的”AI系統(tǒng)的發(fā)展。電腦需要更好地理解人類的語(yǔ)言、情感和意圖。一些大公司已開始試水講解機(jī)器人,以確保它們不會(huì)落在人后。但是,人工智能必須在幾個(gè)重要的方面獲得發(fā)展,才可能有機(jī)會(huì)得到廣泛的應(yīng)用。有些需求是非常明顯的,例如改善語(yǔ)音識(shí)別功能,有些需求則比較隱晦,例如講解機(jī)器人提示它們提供哪些服務(wù)的能力。
健談的講解機(jī)器人必須在這五個(gè)方面獲得長(zhǎng)足發(fā)展,才能夠真正為廣大用戶所接受。
還記得早期的網(wǎng)絡(luò)嗎?當(dāng)時(shí)的頁(yè)面全是閃爍的霓虹燈和藍(lán)色的鏈接?,F(xiàn)在的講解機(jī)器人就相當(dāng)于當(dāng)年的網(wǎng)絡(luò)。如果講解機(jī)器人要得到普及,那么人們必須能夠用自然語(yǔ)言向它問問題和下訂單。無論用戶是使用語(yǔ)音還是文本,你都不要指望他們掌握特殊的詞匯后再與機(jī)器人交流。如果你讓語(yǔ)音助手Alexa播放一首歌,她一開始不明白你的要求,這是可以理解的。經(jīng)常使用它的用戶已與它建立了某種“關(guān)系”,當(dāng)然愿意忽視這些問題了。但是,如果用戶首次向某個(gè)新的講解機(jī)器人預(yù)定電影票而沒有搞成功,那么他們可能會(huì)到其他地方去買票。
現(xiàn)在,神經(jīng)語(yǔ)言學(xué)發(fā)揮了很大的作用,但是它應(yīng)付方言、俚語(yǔ)和詞語(yǔ)還有點(diǎn)困難。語(yǔ)音識(shí)別技術(shù)能夠隨著時(shí)間的推移逐步掌握人們的說話方式。但是,如果你一年才給一個(gè)企業(yè)打一次電話,那么講解機(jī)器人就很難學(xué)會(huì)你的說話方式了。我們還處在人機(jī)相互的早期階段。
這一切都會(huì)反映在品牌的形象中。講解機(jī)器人不能僅僅復(fù)制當(dāng)前自動(dòng)語(yǔ)音服務(wù)的模式。由于社交媒體往往會(huì)放大用戶的負(fù)面評(píng)價(jià),因此企業(yè)需要把事情做對(duì)。人們現(xiàn)在通過網(wǎng)絡(luò)和移動(dòng)應(yīng)用程序所在的一切事情都應(yīng)該可以通過自然語(yǔ)言來實(shí)現(xiàn),但是我們還沒有發(fā)展到這一步。
人工智能要發(fā)揮作用,最關(guān)鍵的問題就是理解背景信息。正如營(yíng)銷和銷售會(huì)以360度的視角來了解消費(fèi)者,講解機(jī)器人也需要更深入地了解它們互動(dòng)的對(duì)象:他們是誰,他們是如何變成現(xiàn)在這個(gè)樣子的,他們?cè)趯ふ沂裁?,以及他們過去做過什么。這些信息必須被收集并在講解機(jī)器人之間分享。只有了解了這些背景信息,講解機(jī)器人才能穩(wěn)定地、持續(xù)地滿足人們的需求。
例如,擇校咨詢服務(wù) AdmitHub去年與佐治亞州立大學(xué)合作用講解機(jī)器人來處理新生入學(xué)和助學(xué)金發(fā)放流程。在早期,講解機(jī)器人幫助該校處理入學(xué)、助學(xué)金和學(xué)生活動(dòng)室等問題,結(jié)果它大大提高了學(xué)生登記入學(xué)的效率。該校希望隨著時(shí)間的推移講解機(jī)器人能夠更好地理解每個(gè)學(xué)生的學(xué)業(yè)和資助情況。等到這些學(xué)生畢業(yè)的時(shí)候,這些機(jī)器人就了解了他們的一切信息。
網(wǎng)絡(luò)是一個(gè)神奇的相互連接的地方。在谷歌搜索引擎中輸入任何產(chǎn)品名稱,你很快就會(huì)聯(lián)系到銷售這款產(chǎn)品的商家。講解機(jī)器人也需要按照這種方式來發(fā)展。因此,講解機(jī)器人之間應(yīng)該能夠靈活地相互介紹用戶,從而順暢地完成交流。
如果我在Facebook Messenger中輸入“我想要漢堡”,那么它應(yīng)該能夠?qū)⑦@個(gè)信息傳遞給其他講解機(jī)器人,從而讓其他講解機(jī)器人安排相應(yīng)的服務(wù)來滿足我的訂單。在網(wǎng)上,這一切是通過REST API來實(shí)現(xiàn)的。講解機(jī)器人領(lǐng)域有很多API在爭(zhēng)奪人們的注意力。講解機(jī)器人需要成熟的聊天API來實(shí)現(xiàn)交互操作。
如果我與一款應(yīng)用程序或一個(gè)網(wǎng)頁(yè)互動(dòng),我能很快看出它通過鏈接提供了哪些服務(wù),以及屏幕上還有哪些其他信息。但是,講解機(jī)器人沒有這種視覺語(yǔ)言能力。當(dāng)你跟一個(gè)講解機(jī)器人說話時(shí),你就相當(dāng)于閉著眼睛在跟它說話。你要事先想好,你準(zhǔn)備問它什么?它能做什么?微軟和亞馬遜一直在努力教消費(fèi)者認(rèn)識(shí)Cortana和Echo等產(chǎn)品的功能。事實(shí)上,很多相關(guān)主題的文章已經(jīng)出現(xiàn)。在第一次與講解機(jī)器人互動(dòng)的時(shí)候,人們應(yīng)該弄清楚:這個(gè)機(jī)器人可以讓我選擇座位,還是只能讓我買票?我可以變更預(yù)約,還是只能進(jìn)行預(yù)約?我可以根據(jù)自己的需求來點(diǎn)餐嗎?由于沒有視覺化的提示信息,講解機(jī)器人需要找到一種新的方式來提示它提供哪些服務(wù)。
如果講解機(jī)器人能夠閱讀人類的面部表情或語(yǔ)音變化,從而理解與它們交流的人的情感變化,那么它們將無疑能夠提供更好的服務(wù)。講解機(jī)器人現(xiàn)在只能應(yīng)付簡(jiǎn)單的客戶服務(wù)。如果用戶感到失望或惱怒,那么講解機(jī)器人可能需要將對(duì)話交給人類客服人員了。但是,現(xiàn)在還有一整個(gè)類別的服務(wù),如咨詢或治療,完全是建立在與用戶互動(dòng)基礎(chǔ)上的。人工智能和電腦視覺的發(fā)展將會(huì)讓這一切變成可能,但是它們還有很長(zhǎng)的路要走。
講解機(jī)器人具有廣闊的應(yīng)用前景,無論是在工作上,還是在我們的個(gè)人生活中。但是,我們需要解決好上述這幾個(gè)問題,才能讓它們變成主流。一旦解決了這些問題,講解機(jī)器人就會(huì)給我們帶來更大的便利和更好的體驗(yàn)。