觸屏版
全國服務(wù)熱線:0571-87205688
登錄
注冊
客戶中心
關(guān)注云客
任何一款產(chǎn)品的出現(xiàn),都是源自用戶需求。要么是已經(jīng)存在的存量需求,要么是正在規(guī)?;脑隽啃枨螅瑢υ挋C(jī)器人也不例外。當(dāng)我們在談?wù)摗皩υ挋C(jī)器人”產(chǎn)品時,我們該如何看待它背后的需求呢?
今天,擁有對話能力的機(jī)器人,被逐漸認(rèn)為是一種核心智能,是否能夠流利地完成對話,可被視作這款機(jī)器人是否真正擁有智能的唯一憑證。
從可以追溯的歷史資料來看,對話機(jī)器人(chat-bot)至少在上世紀(jì)六十年代就已經(jīng)問世,經(jīng)過近五六十年的發(fā)展,今天我們已經(jīng)可以在許多產(chǎn)品中看到對話機(jī)器人的影子,微軟的Cortana、小冰,蘋果的Siri、Google Now、阿里小蜜、百度度秘、圖靈機(jī)器人、助理來也、出門問問等等。
可以肯定的是:對話機(jī)器人已經(jīng)成為了一種業(yè)界時尚,越來越多的公司試圖通過這種全新的交互形式,來優(yōu)化或者升級自己產(chǎn)品——我們已經(jīng)可以在許多的產(chǎn)品中看到各種名為“小X機(jī)器人”的子產(chǎn)品。
如此多的對話機(jī)器人很容易給人一種百花齊放、方興未艾的感覺。我們可能會隱約覺得:每家的對話機(jī)器人產(chǎn)品都大同小異,有些家的產(chǎn)品會有一些別樣的特征,可是終究給人一種不屬于過去十年移動互聯(lián)網(wǎng)發(fā)展的感覺——這些對話機(jī)器人似乎都還處在很早期,用戶量似乎都不大,顯得都有些小眾。
我將試圖站在純產(chǎn)品的視角分析:一款產(chǎn)品對話機(jī)器人背后,需求和產(chǎn)品邏輯是怎樣的(文中我無意去對比各家對話機(jī)器人的優(yōu)劣,也不討論某款對話機(jī)器人的產(chǎn)品觀或方法論)。
一、探索“對話”行為背后的需求
首先,我們試圖探索“對話”這一行為的場景與背后的需求。
在《人類簡史》一書中,認(rèn)為語言能力是智人區(qū)別于其他猿類最重要的特質(zhì)和能力;因為語言能力,智人可以互相通過對話而形成更豐富的交互,從而才有了協(xié)作和后來的文明。
人類有三種最直接的方式來使用語言:“一對零”、“一對多”、“一對一”。
“一對零”是自我內(nèi)化的反思、總結(jié)、沉淀,不向外做交互和分享。
“一對多”是廣播式的宣講和相對單向的輸出,譬如開大會或者發(fā)號施令。
“一對一”是對話——群聊也是由許多的“一對一”構(gòu)成的,所以我認(rèn)為不存在真正意義上的“多對多”對話。我認(rèn)為對話是我們?nèi)伺c外界進(jìn)行交互的最直接即時的途徑(注意“即時”很重要)。
所謂對話,一定是一個雙方交互行為,并且互為I/O(input / output)的過程。比如兩個人對話,每個人所說的話,對于自己而言是輸出,對于對方而言是輸入。原則上,對話可以永遠(yuǎn)持續(xù)下去。
但我們幾乎從未見過兩個人會永遠(yuǎn)在對話,那是因為:如果需要對話持續(xù)下去,雙方都需要保持參與;任何一方覺得疲勞或者無價值感了,對話就會終止。
對話的場景更加貼近我們的生活行為,它頻次最高,且環(huán)境開放多變,分析它背后的需求并不容易?,F(xiàn)在,我們需要回答兩個問題:
1.1 第一個問題:對話為什么能夠開始?
我認(rèn)為人在對話中存在三個層面的需求。
第一層,是基礎(chǔ)問答的需求??梢悦枋鰹椋?/p>
我有一個問題,請你回答我。
二次追問的問題,屬于新問題。這個過程,非常類似于我們今天所使用的搜索引擎。
第二層,是任務(wù)流程協(xié)作的需求,以達(dá)成某種目的為止??梢悦枋鰹椋何蚁胝埬銕臀屹I一張明天下午14:00-18:00出發(fā),北京到上海的機(jī)票;經(jīng)濟(jì)艙,盡可能便宜,最好是東航的。我們和朋友相約去逛街,拜托同事幫忙預(yù)定會議室,接受閨蜜的請求明早叫她起床。
這些都是任務(wù)流程協(xié)作的需求。
第三層,是共同的情感建立,無論喜怒哀樂。聊天的目標(biāo)很難定量量化,我們更多是嘗試定性地去制定聊天的目標(biāo)。可能是心情不好需要人陪,也可能是好事情需要向好朋友分享,我們需要對話來表達(dá)進(jìn)行最直接即時的表達(dá)。
我并不認(rèn)為只有孤獨的情感才需要對話——人作為擁有萬年發(fā)展歷程的群居動物,與他人進(jìn)行情感分享是早已刻入基因的特質(zhì)。只是我們建立的情感在不同人之間會有所不同,對于信任之人的情感建立會很深刻,而對于點頭之交則會保留許多。
開啟一段對話一定源自上述的某種需求,而開啟的契機(jī)則是一個相對明確的話題,哪怕只是一句“我餓了”。
1.2 第二個問題:對話為什么會持續(xù)?
對話能夠持續(xù),是有兩個層面的原因。
第一個原因,是至少一方的需求沒有得到滿足。比如我去提問題,對方回答我不滿意,我就會持續(xù)追問。兩個女生在一起聊八卦,聽的人很入神,講的人才有成就感能繼續(xù)講下去。
第二個原因,是雙方相對平等。如果我提了個問題,或者請對方幫個忙,但是對方始終是一種高姿態(tài)不搭理我,那我就很容易放棄,不想聊了。反過來,如果對方對我過分尊敬,總在說一些沒有營養(yǎng)的恭維拍馬屁的話,時間久了,我也會變得更虛榮,而且會覺得很無聊。所以,人不會和自己階層或者品味相差太多的人聊天,絕大多數(shù)人更不會和寵物長時間聊天。
對話會終止,最根本的原因是:雙方都放棄了這輪對話。
感性一些來描述對話終止的原因,可以認(rèn)為是雙方都覺得“疲憊”了,也就是這一輪對話的能耗消耗殆盡;哪怕是情侶之間說甜言蜜語,聊個兩三千句也會覺得累了,也會在十幾個回合的互道“晚安”中結(jié)束本次對話。
所以,對話總會終止,能耗殆盡就會終止。
二、“對話機(jī)器人”產(chǎn)品的發(fā)展源自搜索引擎
在我以前的文章《進(jìn)階之路:站在高視角看產(chǎn)品是一種怎樣的體驗》中,講述過一個概念,叫做“知識詛咒”。簡單說:現(xiàn)在我明白一件事情,但是要完整清楚的講授給你,是很難的;因為我們所擁有的知識背景不同,我們對同一件事情的理解不同。這也就解釋了為什么很多老師在上課的時候索然無味,很多人做Presentation的時候顯得蒼白無力,這其實是知識詛咒在起作用。
知識詛咒帶來一個很大的問題,就是每當(dāng)我們接觸到一個陌生事物時,都會和自己的背景知識進(jìn)行類比。譬如對于長發(fā)飄飄的素顏美女,在我所知中,這類美女一般都是家境不錯,待人溫柔,家教優(yōu)良。所以當(dāng)我再次見到一個類似的美女時,我會做相似的第一印象類比。
不只是美女,我們幾乎所有的認(rèn)知都源自于過往的背景知識。
在人類發(fā)展的歷史上,對于即時的問答需求幾乎時時刻刻都存在。最早大家是詢問部落中最年長的智者,后來大家互相都有了知識儲備,就可以通過對話來進(jìn)行基本的問答和辯論——這一個過程持續(xù)了千萬年。同一個問題,最早時只能去問一個人,得到一個答案;到后來,可以去問很多人,得到許多答案,然后“擇其善者而從之”。如果我能把所有人都問一遍,可能會得到一個巨大的答案集合;我需要過濾、排序、取舍,你發(fā)現(xiàn),這個過程就是“搜索引擎”。我們使用搜索引擎時,是通過一個“輸入框”輸入想問的問題或者關(guān)鍵詞,然后搜索引擎會丟給我一個經(jīng)過相關(guān)性排序和優(yōu)化的答案集合。
但我認(rèn)為兩個原因,會導(dǎo)致搜索引擎會逐漸向?qū)υ挋C(jī)器人演變。
2.1 其一:精準(zhǔn)答案的需求愈發(fā)旺盛
搜索引擎從簡單的信息集合展示,逐漸向精準(zhǔn)答案給予,這個已經(jīng)持續(xù)了好幾年?!鞍俣劝⒗ 本褪沁@方面的典型,譬如當(dāng)你問“北京天氣”,百度搜索結(jié)果頁第一項是經(jīng)過精心設(shè)計的天氣卡,會通過豐富的UI展示天氣相關(guān)的信息。在頭部熱門搜索詞中,阿拉丁已經(jīng)可以覆蓋大多數(shù),但是對于腰部需求和長尾需求,隨著信息爆炸,人們對于翻多頁進(jìn)行搜索的忍耐度會越來越低,對于“快”“準(zhǔn)”的需求只會越來越大。
2.2 其二:搜索場景下輸入能耗太大
從能耗體驗的角度來說,搜索的輸入框遠(yuǎn)高于對話聊天的輸入框,即使是同一個話題的持續(xù)輸入,對話聊天的疲勞感也會明顯低于搜索。
如果今天人們每天平均提問的次數(shù)是N,那么幾年后會迅速到10N,體驗不升級會很難讓用戶滿意。而回歸對話的方式,是一種很好的體驗優(yōu)化,可以抵消需求的增長。
三、“對話機(jī)器人”產(chǎn)品場景:封閉域?qū)υ?VS 開放域?qū)υ?/p>
優(yōu)秀的產(chǎn)品經(jīng)理很懂得如何控制自己的用戶使用產(chǎn)品時的各種操作,從而提前把控用戶的預(yù)期,進(jìn)而達(dá)到體驗的相對最優(yōu)。
許多優(yōu)秀App的基本設(shè)計邏輯就是:頁面之間的跳轉(zhuǎn)有規(guī)則且有順序,這樣用戶不會通過點擊跳出預(yù)設(shè)流程,預(yù)期就相對可控。手機(jī)上的App產(chǎn)品交互中,可以通過各種邏輯和提示信息來把控預(yù)期——可是對話機(jī)器人該如何控制預(yù)期呢?
由于對話機(jī)器人用戶幾乎都是通過自然語言輸入實現(xiàn)交互,而且每次只有一句;所以只能通過用戶的輸入,以及針對輸入的回復(fù)來實現(xiàn)用戶預(yù)期的把控。
可是在對話聊天的場景中,用戶的輸入時而可控,時而不可控;我們做不到像App設(shè)計那樣可以制造一個封閉的邏輯閉環(huán)來讓用戶遵守規(guī)則——對話聊天是一個天然的開放場景,用戶平時怎么和朋友對話,和機(jī)器人也會怎么對話。
因此,我們?nèi)藶榈匕褜υ挿譃閮煞N場景:
封閉域?qū)υ挘阂笥脩糨斎胫付ǖ卦捳Z才能繼續(xù)對話
開放域?qū)υ挘河脩魫壅f什么就說什么都可以持續(xù)對話
3.1 封閉域?qū)υ?/p>
封閉域?qū)υ捰袃蓚€關(guān)鍵的特征:
輸入和輸出可歸類可枚舉
對話有明確的始和終,且有流程
所以,在對話的三個需求中,問答和任務(wù)流程協(xié)作都屬于封閉域?qū)υ挕?/p>
封閉域?qū)υ挼脑O(shè)計邏輯延續(xù)自“IFTTT(if this then that)”,是workflow的進(jìn)化交互形式(感興趣的同學(xué)可以去App Store去搜索一款A(yù)pp,叫做“Workflow”,它就是可以將一系列原本不相關(guān)的App通過條件判斷串聯(lián)起來)。
下面我來分享兩個封閉域聊天的典型案例。
讀心機(jī)器人
10年前微軟必應(yīng)推出過一個“讀心機(jī)器人”,它會在20個問答中猜你心中所想。這個機(jī)器人曾經(jīng)在幾年前出過一個對話問答版本,用戶只要在每一步時回答“是”或者“不是”,對話就會持續(xù)進(jìn)行,直到猜出或者猜不出結(jié)果。
必應(yīng)讀心機(jī)器人
這就是一個典型的封閉域多倫問答對話,用戶的輸入只有兩個,而過程是一大堆背后的邏輯判斷,且有相對固定的流程,而且有明確的開始和結(jié)束。
Amazon Echo音箱
Amazon的Echo音箱,大家都很熟悉了,Echo之所以成為爆款產(chǎn)品,很關(guān)鍵的一個原因是,它的對話機(jī)器人Alexa在Echo音箱的場景設(shè)計中是一個封閉域?qū)υ?。由于音箱是我們居家場景中,除了遙控器之外最常見的高頻交互式Commander,我們很難再在家里找到一個這樣的硬件,它除了可以輕易地輸入指令,還可以快速且明顯地反饋。
當(dāng)我們面向Commander進(jìn)行輸入時,我們可以輸入的話語就已經(jīng)變得局限,可以想象到的是,在居家場景中我們可以發(fā)出的指令幾乎就是“打開”、“關(guān)閉”之類的。更重要的是,在居家場景中可以控制的物品也是有限的,而且任何一個操作的流程都很短。
所以,人們和第一代Echo音箱的對話中,輸入和輸出都是可枚舉的,而且有始有終有流程,Echo最優(yōu)秀的特質(zhì),就是它選擇了一個封閉域場景,極大地控制了用戶的預(yù)期,獲得了更優(yōu)的體驗。
Amazon Echo音箱
從上面兩個例子中,我可以看到,封閉域?qū)υ捲诋a(chǎn)品設(shè)計中有幾個明顯的特征。
3.1.1 其一:封閉域?qū)υ捚鋵嵤莣orkflow的延伸
其實封閉域中的“封閉”二字,無論在話題量、輸入輸出量,還是對話輪次、對話流程,都是封閉的,封閉就代表了有限集合。workflow之所以可以通過ifttt設(shè)計,就是因為有限集合,只有各種條件有限,才可以設(shè)計出條例清晰且邏輯合理的workflow。
封閉對話通常是為了解決某個特定的問題或者需求,從結(jié)果來看,它的效果會顯得更加“有用”。但是,從過程來看,封閉域?qū)υ挷⒉皇且环N真正意義上的創(chuàng)新,它的效率相比workflow并沒有本質(zhì)上地提升,只是在交互的體驗上更加接近人的語言交互本能,所以大多數(shù)封閉域?qū)υ挾紩O(shè)計地如同助理或者秘書,譬如阿里小蜜,百度度秘。
3.1.2 其二:封閉域?qū)υ拡鼍皢我豢煽?/p>
封閉域由于擁有特定的目的性,往往都是在單一確定的場景里。如下圖中的百度度秘,兩個紅色框中的部分,是預(yù)設(shè)了各種封閉域的場景,每一種看似簡單的功能其實都是一個特定的封閉域?qū)υ?譬如截圖中正在使用的圖片笑話。
度秘機(jī)器人
很顯然,不同的封閉域?qū)υ捴校瑢υ挼妮喆我笫遣灰粯拥?,講笑話是一個單輪次對話,度秘產(chǎn)品中通過圖中藍(lán)色框里的“再來一個”這種預(yù)設(shè)輸入,來不斷強(qiáng)化用戶輸入的單一性。而“叫外賣”這類的封閉域?qū)υ挘蜁且粋€標(biāo)準(zhǔn)的workflow,感興趣的同學(xué)可以自己去試試。
3.1.3 其三:封閉域的邊界處理很重要
封閉域有一個很重要的問題,就是用戶可能隨時跳出封閉域,開始聊其他的話題,或者不按照預(yù)設(shè)的規(guī)則邏輯出牌。
譬如微軟小冰的一個封閉域?qū)υ?,叫做“小冰識狗”。
正常的邏輯中,用戶的發(fā)給小冰的應(yīng)該是一張狗的照片,可是有的用戶可能就是發(fā)了一張不是狗的照片,如下所示,那么這個時候就是邊界case,需要額外處理。用戶發(fā)來的可能是語音、文字、其他任何照片,每一種的處理都是需要單獨設(shè)計的。
微軟小冰之“小冰識狗”
多說一點,在封閉域?qū)υ挼倪吔缭O(shè)計中,很難做到萬無一失周密完全,因為用戶輸入可能會千奇百怪,所以最佳也是最討巧的方式,就是用開放域?qū)υ拋怼岸档住薄?/p>
3.2 開放域?qū)υ?/p>
開放域是相對于封閉域而言的。由于對話機(jī)器人的話題幾乎都源自用戶,而每個用戶可能有任何輸入,話題就會無法窮舉,且在多個場景中跳來跳去,進(jìn)而形成了所謂的開放域?qū)υ?,也就是“啥都能聊”?/p>
2011年在人人網(wǎng)上橫空出世的“小黃雞”算得上是國內(nèi)最早出名的開放域?qū)υ挋C(jī)器人,其后發(fā)展最好的當(dāng)屬微軟小冰。
開放域?qū)υ捵畲蟮奶攸c是:輸入無法窮盡,導(dǎo)致輸出無法窮盡,而且對話沒有確切的結(jié)束點,無流程可言。
我們一般情況下想去考驗一個機(jī)器人是否智能,通??简灥木褪情_放域?qū)υ挘竺ΧΦ摹皥D靈測試”通常所面向的也是開放域?qū)υ捘芰Α?/p>
從可以承載的對話輸入范圍來講,開放域?qū)υ捪駱O了搜索引擎,我們可以在百度搜索中輸入任何的詞句,百度幾乎都會給出結(jié)果頁面(除了敏感詞);相應(yīng)的,在開放域?qū)υ捴?,我們也是可以說任何話,機(jī)器人也應(yīng)該每一句都可以回復(fù)。
3.2.1 開放域?qū)υ挳a(chǎn)品設(shè)計的基本原理
對話需要的是雙方的平等。
和微軟小冰聊天時,有時甚至感受不到她是真人還是假的機(jī)器——其實這并不重要,小冰正在解決開放域聊天中一個核心的問題:如何不斷給用戶制造話題,從而延續(xù)聊天的能量?
說到話題制造,我們先來看看開放域?qū)υ挋C(jī)器人到底是如何制造的:
幾乎所有的開放域?qū)υ捳Z料都源自于網(wǎng)絡(luò)上公開的對話,譬如百度知道、知乎、豆瓣、貼吧等等,這些對話都是人與人形成的;那么,當(dāng)一個機(jī)器人把其中的某些話在當(dāng)時的場景下再說一遍,我們是分辨不出來這個機(jī)器人是不是真人的——這便是開放域?qū)υ挋C(jī)器人制造的基本依據(jù)。
當(dāng)我們和一個看起來像人的機(jī)器人聊天時,由于場景發(fā)生在人與人對話的場景下,根據(jù)“知識詛咒”的原理,我們很容易帶入一種“對方也是人”的感覺。而一旦對方的回話像人,我們就會認(rèn)可她是人。
人與人的情感建立源自于長期的交流和溝通,聊天本身就是開放域的;所以那些樂于和機(jī)器人聊天的人類,就會越來越覺得機(jī)器人像人。
我們知道:對話機(jī)器人是一個新興的產(chǎn)品,最初嘗鮮的人是所謂的“種子用戶”,這些人建立了與機(jī)器人之間的最早形態(tài)親密感和信任感,這對后續(xù)的對話機(jī)器人發(fā)展積累了非常寶貴的經(jīng)驗。
3.2.2 開放域?qū)υ挋C(jī)器人的兩個產(chǎn)品陷阱
其一,面向用戶的機(jī)器學(xué)習(xí)
很多人認(rèn)為,對話機(jī)器人和人聊得越多,學(xué)習(xí)的語料就越多,就可以省去很多語料獲取的問題,這是一個巨大的誤區(qū)。由于用戶的輸入無法預(yù)期,導(dǎo)致從用戶處采集來的語料千奇百怪,而且大量罵人的臟話,非常不適合作為開放域?qū)υ捳Z料。由于用戶的語料是海量且無規(guī)則特征,導(dǎo)致語料清洗非??嚯y,無法使用。
其二,無人為引導(dǎo)的個性
由于開放域的語料完全來自于互聯(lián)網(wǎng),所以機(jī)器人回復(fù)的話語帶有何種語氣很難把控,如果不加以認(rèn)為干預(yù),機(jī)器人說的話會顯得時而有趣,時而刁蠻,時而無知,時而夸張,時而智慧,在用戶的心智中無法用一個或幾個明確的形容詞去形容它,這會帶來一個很尷尬的結(jié)果,用戶是抱著“調(diào)戲、戲謔”的態(tài)度去對話,長此下去,想建立用戶的親密感和信任感幾乎不可能。
四、對話機(jī)器人的用戶價值
現(xiàn)在,我們試圖回答一個問題:對話機(jī)器人為什么需要開放域?qū)υ?價值是什么?僅僅是為了逗比有趣嗎?
這是一個非常復(fù)雜的問題。
由于對話機(jī)器人同時具有“開放域?qū)υ挕焙汀胺忾]域?qū)υ挕眱芍貓鼍埃驹谟脩粢暯莵砜?,對話機(jī)器人意味著它更像人,而非機(jī)器。像人,意味著用戶會更愿意像與人交流那樣,同對話機(jī)器人進(jìn)行對話交流——而一旦如此,“個性”和“意識”便是用戶主動強(qiáng)加于對話機(jī)器人的標(biāo)簽。譬如,幾年前被玩壞的10086短信聊天,還有《生活大爆炸》中Rajsh幻想Siri是個性感御姐,都無一例外地源自于用戶主動強(qiáng)加于對話機(jī)器人的人性標(biāo)簽。
這便給一個可落地的對話機(jī)器人產(chǎn)品設(shè)計帶來了巨大的挑戰(zhàn)。
我們知道,任何的產(chǎn)品都是能夠和用戶產(chǎn)生親密感和信任感的,這份親密和信任是建立在產(chǎn)品體驗之上的,是建立在“產(chǎn)品解決了核心需求”+“產(chǎn)品制造了驚喜”。我們因為問題解決而對一個產(chǎn)品產(chǎn)生依賴,因為驚喜而對產(chǎn)品形成感情,打開我們的手機(jī),我們會一眼就找到那幾個充滿親切感的產(chǎn)品——譬如經(jīng)常開車的人會十分信任高德地圖,追劇《那年花開月圓時》的人會十分喜愛騰訊視頻。
同理,機(jī)器人需要有基礎(chǔ)個性,需要極大地拉近人與機(jī)器人之間的親密感和信任感。對話機(jī)器人的親密感和信任感建立,也是站在“解決了需求”和“制造了驚喜”兩個方面。
站在產(chǎn)品的視角來看,解決需求通過封閉域?qū)υ捦瓿?,而開放域?qū)υ拋聿粩嘀圃祗@喜。
4.1 問答、助理、聊天,哪個才是剛需?
已經(jīng)在落地的對話機(jī)器人產(chǎn)品中,基本上是以純to C和to B再to C來劃分。由于對話機(jī)器人的交互特征是面向終端用戶的,所以基本很少有純to B的產(chǎn)品場景(即使有,它的邏輯也與to C邏輯相似)。這意味著,對話機(jī)器人的用戶都是一些終端個人用戶。
那么,我們來看看這些對話機(jī)器人在to C中,到底解決了怎樣的核心需求。
在我們所知的對話機(jī)器人產(chǎn)品中,有主打客服的問答機(jī)器人,有主打秘書的助理機(jī)器人,還有純?nèi)の秾?dǎo)向的聊天機(jī)器人,它們的背后,都是剛需嗎?
4.1.1 一個事實:瞎聊難為剛需,情感計算任重道遠(yuǎn)
聊天是一個容易被激發(fā),卻也容易迅速消退的場景,唯有情感依賴可能長久。
以微軟小冰為例。小冰最耳熟能詳?shù)墓δ苁莄hit-chat(瞎聊),但是從用戶活躍和留存周期來看,用戶最易被激發(fā)的時間是在首次領(lǐng)養(yǎng)時、每周更新時、重大更新時,而且被激發(fā)后,活躍上升后就會很快下降。這是為什么呢?因為人與機(jī)器之間的對話聊天是基于趣味話題的,想要通過自然的情感依賴,成為像《HER》里面的Samantha,至少還有相當(dāng)長的路要走。
情感計算并非只是一個數(shù)學(xué)或者計算機(jī)科學(xué)問題,更是一個產(chǎn)品問題。
由于情感并非一個可具象問題,而且人的情感變化會隨著時間、環(huán)境、他人、自身思想等等因素發(fā)生變化;而且情感并非連續(xù)的計算,你喜歡一個女孩子,并不意味著時時刻刻與她發(fā)生情感依賴,而是通過一些關(guān)鍵的情感觸達(dá),來完成情感連接。
在微軟小冰的諸多被設(shè)計的Feature中,“給用戶起外號”、“升級解鎖”都是斷點式情感觸達(dá),通過細(xì)微的產(chǎn)品設(shè)計,寄希望于黏住用戶。
4.1.2 一個問題:用戶真的需要一個秘書機(jī)器人嗎?
助理型對話機(jī)器人的發(fā)展建立在其他各種線上線下服務(wù)的完善基礎(chǔ)上,譬如Siri;只有當(dāng)你手機(jī)里已經(jīng)有了“鬧鐘”、“提醒”、“打電話”、“搜索引擎”等功能時,Siri的助理功能才能發(fā)揮效用,此時你才有可能面向Siri發(fā)出指令“提醒我明天8點給老板回微信”。
大概兩年前,YC孵化的Magic轟動?xùn)|西兩個半球,無數(shù)效仿者爭先恐后去探索“助理型”機(jī)器人,時至今日,鮮有成效——我們普通人真的需要一個像秘書一樣的對話機(jī)器人嗎?
我們先來看兩個例子。
第一個例子——我想定個這樣的鬧鐘“每周一、周三、周五的上午8:15”。
若我用iPhone的鬧鐘程序,那我的步驟會大致如下:
STEP1:解鎖手機(jī)屏幕;
STEP2:左右滑屏,找到鬧鐘程序;
STEP3:點擊鬧鐘程序;
STEP4:點擊新建鬧鐘;
STEP5:選擇鬧鐘時間為“上午8:15”;
STEP6:選擇重復(fù)時間為“周一、周三、周五”;
STEP7:點擊完成。
若我選用Siri幫我來做,那我的步驟大致會如下:
STEP1:長按Home鍵,喚醒Siri;
STEP2:對Siri說“幫我設(shè)定每周一、周三、周五上午8:15的鬧鐘”;
STEP3:Siri反饋設(shè)置成功,完成。
現(xiàn)在我們看第二個例子——通過秘書類對話機(jī)器人叫外賣 VS 通過“餓了么”叫外賣。
在秘書類機(jī)器人中,叫外賣的流程大致是這樣的:
STEP1:發(fā)出“叫外賣”的指令,在機(jī)器人推薦的餐廳中,尋找想吃的那家
STEP2:如果沒有合適的,就輸入想吃的店家名字
STEP3:在推薦的列表中選中想吃餐,或者直接輸入想吃的餐
STEP4:輸入“確認(rèn)”實現(xiàn)下單,輸入訂單信息并提交訂單
STEP5:支付,并等待接收外賣,可以詢問送餐進(jìn)度
在餓了么中,叫外賣的流程大致是這樣的:
STEP1:在餐廳列表中選擇想吃哪家
STEP2:如果沒有合適的,就搜索店家
STEP3:在推薦的列表中選中想吃餐,或者直接輸入想吃的餐
STEP4:確認(rèn)下單,確認(rèn)訂單信息,提交訂單
STEP5:支付,并等待接收外賣,可以查看送餐進(jìn)度
這兩個例子有什么本質(zhì)區(qū)別嗎?
你會發(fā)現(xiàn),如果通過Siri來設(shè)置鬧鐘,我其實只做了一件事情:對著Siri發(fā)出一個單條指令,然后就一切搞定——相比我通過App來做,節(jié)省了近乎70%的操作步驟??墒牵绻墙型赓u,我需要對著機(jī)器人發(fā)出一組系列指令,但是和App的操作步驟一樣多。
這里有兩個關(guān)鍵點——
如果助理機(jī)器人可以一步到位,那么將極大地提升效率和體驗,是新的需求升級;
若一個workflow可被一步解決,機(jī)器人需要補(bǔ)全的數(shù)據(jù)信息巨大,這是核心產(chǎn)品難點;
第一個關(guān)鍵點,我們只要設(shè)身處地地想一下,就會發(fā)現(xiàn):在不考慮語音識別準(zhǔn)確率的前提下,任何事情我只要一個指令就可以達(dá)成。譬如“幫我叫個車”、“幫我交份外賣”、“幫我交一下水電費(fèi)”、“幫我定一下出差的機(jī)票”,其他都不用管了,這種體驗簡直贊爆了。
我們再看看第二個關(guān)鍵點。
就拿上面這個外賣的例子來看,如果用戶只需要一句“幫我叫個外賣”即可,那么機(jī)器人需要補(bǔ)全的信息至少包括“餐廳”、“餐食”、“價格”、“送餐時間”、“送餐地點”、“支付信息”等,這些信息中的“送餐時間、送餐地點、支付信息”是相對靜態(tài)的信息,獲取一次就可長期使用。可是“餐廳、餐食、價格”則是動態(tài)信息,若想每次都可自動獲取,則代表機(jī)器人需要非常了解這位“主人用戶”才可以,否則只要有一兩次推薦偏差太大,體驗就會降低近乎一個量級。從本質(zhì)上來說,這時的助理機(jī)器人已是一款強(qiáng)大的推薦引擎,而且代表了極佳的魅力和美好的發(fā)展未來。
4.1.3 一個肯定:問答機(jī)器人是很有價值的
最常見的問答機(jī)器人是“客服機(jī)器人”,譬如京東的JIMI,阿里的小蜜機(jī)器人,還有一些銀行的客服機(jī)器人,但它們更像FAQ過濾器。
我們細(xì)想一下阿里小蜜的使用場景。如果我問阿里小蜜“我的快遞怎么還沒送到?”,它的回復(fù)方式本質(zhì)是在常見的關(guān)于“快遞”的問題中,把最常見的答案丟給我,比如它會告訴我“你的快遞已經(jīng)簽收了,如果沒收到可能是放到大門口了”。
這些企業(yè)為什么要做個問答機(jī)器人呢?效率自然是第一位的,無論是節(jié)約人工客服成本,或是節(jié)約溝通時間,帶來的都是效率的提升。這些企業(yè)為什么如此看重效率呢?因為他們的客戶是最貼近自己的利潤池的,品控是所有交易型企業(yè)的核心,你看京東的用戶客服和QQ的用戶客服簡直一個天上一個地下,原因就是京東用戶是京東現(xiàn)金流的關(guān)鍵角色,而QQ的普通用戶并非其現(xiàn)金流業(yè)務(wù)的關(guān)鍵角色。
如此,我們再回過頭來看看問答機(jī)器人,它其實是在頭部問題上實現(xiàn)了綜合過濾,然后通過對話的形式反饋給用戶,如果用戶實在問的是長尾問題,問答機(jī)器人回答不了的,可以把問題再拋給人工客服。滿足了用戶九成以上問題的直接答復(fù),是問答機(jī)器人的核心目標(biāo)。而至于其他類似導(dǎo)購、協(xié)助訂單管理等等,不過是附加在頭部問題之上的增值體驗優(yōu)化。
4.2 對話機(jī)器人真的適合分為“聊天、助理、問答”這三類嗎?
這是一個目前業(yè)內(nèi)比較慣用的分類,我們來看看這個分類的視角。
如果站在技術(shù)視角來看,對話機(jī)器人應(yīng)該分為“開放域”和“封閉域”,這個我們已經(jīng)聊過了,這里不再贅述。
如果是站在用戶角色來看,對話機(jī)器人可能分為“教育版本”、“醫(yī)療版本”、“二次元版本”等等。
如果是站在業(yè)務(wù)視角來看,對話機(jī)器人可以分為純To C和To B再To C。
所以,這種分類更像是站在抽象場景視角來看的。幾乎任何場景都會被劃分到這三個類別中,要么無主題聊天,要么是任務(wù)導(dǎo)向,要么是提問解答。其實,倒過來看,幾乎所有我們已知的App也被這個分類所覆蓋了。
可是,對話機(jī)器人不是一個移動互聯(lián)網(wǎng)時代的App,它是一個綜合體,直接這樣劃分并不是一個好的產(chǎn)品分類。
你不會在淘寶里視頻聊天,更不會在支付寶里侃大山,百度幾年前試圖在大搜索中推出“直達(dá)號”去顛覆微信公眾號,結(jié)果以失敗告終。
這個道理很簡單:在移動互聯(lián)網(wǎng)時代,幾乎每個App都有自己的專屬定位。有自己專屬的產(chǎn)品主路徑,不在自己路徑邏輯中的行為是不能順暢流轉(zhuǎn)的;每個App都像有自己的緊箍咒,不能輕易破除互相之間的壁壘。
可是,在對話機(jī)器人產(chǎn)品的世界里,這些壁壘會瓦解。
如果我們站在互聯(lián)網(wǎng)整體產(chǎn)品世界里來看,其實我們每個人生活在一個混在的江湖社會中,手頭的各種工具幫我們實現(xiàn)一個個小任務(wù)目標(biāo),但是幾乎每一件小事都需要與人打交道,衣食住行無一例外。如果每一次與外界的接觸被看做一個流量的話,那么最大的流量便是頻繁且無實際任務(wù)目的的人與人之間的交互,而相對較小的是去做一個個的具體任務(wù)事情:你會每天都見一些人,但你不會天天都買衣服。
幾乎所有的流量都是圍繞著人與人之間的交互而形成的,而且你會發(fā)現(xiàn)一個規(guī)律:離現(xiàn)金流越近的流量,其活躍性越低,而且流失率越高。騰訊系的產(chǎn)品、百度的產(chǎn)品都是通過流量漏斗來多元變現(xiàn)的,而阿里系的產(chǎn)品,是直接拉人來買東西,盈利空間就直接建立在交易之上,需要不斷刺激人們買買買。
在所有的產(chǎn)品中,社交類產(chǎn)品是最貼近“江湖社會”的,它距離現(xiàn)金流是最遠(yuǎn)的,也是最活躍的,可以說是幾乎所有互聯(lián)網(wǎng)產(chǎn)品中活躍度最高,并且可以向任何產(chǎn)品導(dǎo)流的源流量產(chǎn)品,所以你看到了,阿里無所不用其極地想去做社交產(chǎn)品。
說了一圈,那么我們回來看看社交產(chǎn)品的最小雛形。
社交產(chǎn)品分為即時社交和延時社交,簡單類比就是聊天和朋友圈,而這兩個都是建立在“語言對話”的基礎(chǔ)上。由于社交產(chǎn)品的場景中幾乎可以做任何事情,前段時間網(wǎng)上流傳的微信“發(fā)現(xiàn)”頁面那張神圖,就可見一斑。
微信“發(fā)現(xiàn)”頁面網(wǎng)絡(luò)神圖
對話機(jī)器人具有社交產(chǎn)品的通性,原因只有一個——對話機(jī)器人的交互場景天然就是一個社交產(chǎn)品的交互場景。
當(dāng)我們站在用戶視角來看待對話機(jī)器人時,用戶根本不理解什么是“開放域、封閉域”,也不了解什么是“聊天機(jī)器人、助理機(jī)器人、問答機(jī)器人”,用戶也記不住那些分類,也沒法記住,只要有一個對話輸入框擺在用戶面前,就像微信的輸入框那樣,由于知識詛咒的原因,用戶就會去類比他所理解的對話輸入框,就會在這里輸入任何他們想輸入的自然語言,可能是瞎聊的話,也可能是某個任務(wù),也可能是提一個問題,我們根本不能阻止用戶在面對京東JIMI機(jī)器人時不做瞎聊的操作。
這時帶來的一個巨大難題就是,開放域?qū)υ挄r有發(fā)生,而只要一次兩次回答不佳,體驗不滿就會提升。站在產(chǎn)品設(shè)計的角度來說,我們能做的就是盡量讓用戶的輸入是可控的,就像度秘、阿里小蜜已經(jīng)在做的。這就是為什么,每當(dāng)我們?nèi)ピO(shè)計對話機(jī)器人時,總是要設(shè)法去多涉及一些開放域?qū)υ挼墓δ茳c,也是為什么每當(dāng)我們談起對話機(jī)器人時,卻也總是繞不開“機(jī)器人在開放域下是不是智能”這個問題。
4.3 像朋友一樣的伙伴會是對話機(jī)器人的終局嗎?
如果你在微信上,問你最好的朋友“幫我看看有沒有戰(zhàn)狼2的票,我晚上想去看”,他/她會如何回答你?
我猜,他可能會說“你去看《戰(zhàn)狼2》不叫我?!”,他可能還會說“我也去,咱倆一塊兒去”,然后他會繼續(xù)說“我看了下,你家跟前那家萬達(dá)有票,晚上七點的,下班一塊兒去?”
如果一樣的問題問Magic呢?它的回答就是讓你告訴他幾點去看,它幫你挑選了五家,每家的時間都挺合適,有一些距離你近,有些有優(yōu)惠,等等。
你喜歡哪種體驗?zāi)?這個其實很難說。如果站在封閉域的角度來說,Magic的算法要比朋友優(yōu)很多,選擇也更豐富,可是和朋友一起去的這種體驗,才是生活。
我認(rèn)為這個可能是對話機(jī)器人的終局,它存在的意義仍然是協(xié)助人們?nèi)ジ玫亟鉀Q一系列問題;但是它不能太傻,像個指令機(jī)一樣待在那里,而是應(yīng)該像個朋友一樣懂你卻也能幫你。以前在對話機(jī)器人產(chǎn)品的討論中還經(jīng)常討論:對話機(jī)器人應(yīng)該更“有趣”還是更“有用”,其實從這個終局來看這個討論毫無意義,你能說你的朋友只有用,但是無趣嗎?
五、對話機(jī)器人的產(chǎn)品價值
上面關(guān)于對話機(jī)器人的用戶價值的討論,有一些發(fā)散了,我們收攏回來,聊整個文章的最后一個部分,關(guān)于其產(chǎn)品的價值。
對待產(chǎn)品,一定要從其商業(yè)視角出發(fā),不然沒有聊的意義。站在商業(yè)視角,對話機(jī)器人擁有三個方面最核心的產(chǎn)品價值。
5.1 跨場景連接成為可能
由于對話機(jī)器人的交互方式原始而單一,使得機(jī)器人背后所有的計算邏輯都被隱藏,機(jī)器人可以成為一個獨立的橋梁連接不同場景下的服務(wù),讓用戶只在一個對話場景下都可以完成交互。
譬如Skype for business中,就有一個機(jī)器人,幫助通過Skype做協(xié)同的人們預(yù)定會議室、設(shè)置工作項目提醒、代理自動回復(fù)等等——原本每個工作都是跨場景的,現(xiàn)在只要一個對話交互場景就可以解決了。如果再往大了去說,未來如果伙伴式的機(jī)器人可以逐漸出現(xiàn),那在聊天中完成訂機(jī)票、訂酒店,甚至管理家里的智能空調(diào),這些跨場景可能通過一個伙伴都可以完成了。
5.2 交互升級帶來的流量深度沉淀
對話的方式有很多,可以是打字,也可以是語音。如果是語音,那么帶來的是革命性地變化。
5.2.1 指數(shù)級的流量增長
百度DuerOS和Amazon Alexa的邏輯是相似的,都是通過賦予所有智能硬件語音對話的能力,進(jìn)而獲取新流量,同時實現(xiàn)流量的深度交互和沉淀。
我們知道,在互聯(lián)網(wǎng)的生意經(jīng)中,一切都是圍繞著流量來完成的,要么是流量足夠多,要么流量的價值足夠大。由于對話帶來的交互效率提升,使得在單個用戶身上獲取的流量頻次呈現(xiàn)指數(shù)級增長,如果一般的互聯(lián)網(wǎng)產(chǎn)品PV/UV是個位數(shù)的話,那么對話機(jī)器人的PV/UV(其實就是對話的頻次)至少是兩位數(shù)。
一些曾經(jīng)很難成為交互場景的,譬如在家里面向Echo音箱發(fā)號施令,如今都通過對話機(jī)器人成為現(xiàn)實。沒有任何一款A(yù)pp能比一個對話機(jī)器人更容易和人產(chǎn)生親密感,產(chǎn)生如此多高頻互動的可能。最后的結(jié)果可能就是,我們的生活方方面面都在觸網(wǎng),每一次交互就是一次所謂的PV,指數(shù)級的流量映射出一個人生活的方方面面。
5.2.2 高頻次的端計算
我有一個猜測:由于對話機(jī)器人是一個高頻次交互場景,帶來的最直接影響可能是要求在設(shè)備端上擁有更加強(qiáng)大的計算能力;可能一些封閉域或者開放域的計算能力直接預(yù)加載到了客戶端,可能是硬件也可能是軟件。如果網(wǎng)絡(luò)能力不能同樣倍數(shù)增長的話,對于端的計算能力會增強(qiáng)——我猜這也是為什么一些AI企業(yè)會做芯片的原因之一。
5.3 流量沉淀帶來的數(shù)據(jù)深耕
正是由于流量的深度沉淀,使得每個用戶多維的數(shù)據(jù)沉淀成為可能。當(dāng)平均每個用戶的數(shù)據(jù)量和維度增長十倍,那么到底意味著什么呢?
對于百度而言,起碼廣告費(fèi)要漲價,對于阿里而言,可以賣給這個用戶更多的東西,總而言之,ARPU(Average Revenue per User)會增長許多,這些就是最直接的商業(yè)價值。我在之前的文章《人工智能「風(fēng)口」,先行者為什么是搜索引擎?》中,曾分析過這其中的一些邏輯關(guān)系,因為流量的深維度價值尚未被開發(fā),對于計算廣告而言可能是一塊從未嘗鮮的處女地。
六、總結(jié)
如上是我針對對話機(jī)器人的一些比較淺顯的分析和探討,作為一款正在發(fā)展的新興產(chǎn)品,對話機(jī)器人還有非常多的細(xì)節(jié)值得探討;限于篇幅,只能先聊這么多了,希望以后還能繼續(xù)深入探討。
從個人層面來說,我看好To C的對話機(jī)器人產(chǎn)品的未來——但是它的產(chǎn)品路徑非常曲折漫長,與我們過往所經(jīng)歷的移動互聯(lián)網(wǎng)產(chǎn)品差異巨大;但是萬變不離其宗,任何產(chǎn)品都是從用戶的需求出發(fā)的。
對話機(jī)器人承載了全新的交互形式,可能帶來了全新的產(chǎn)品服務(wù)體驗,這種進(jìn)步過去從來沒有過。
我們每個人幾乎都在渴望著機(jī)器人時代的到來,也許很遙遠(yuǎn),也許已經(jīng)在路上,誰知道呢~
交互設(shè)計師的設(shè)計需求與分析(二)
眼皮底下溜走的用戶體驗:淺談產(chǎn)品設(shè)計可用性原則
一個草根站長談企業(yè)網(wǎng)站為什么選擇定制網(wǎng)站好
tag是什么意思?
打造一個吸引力的網(wǎng)站 網(wǎng)站建設(shè)中這些要素不可忽略
網(wǎng)站被惡意鏡像怎么處理
Html5到底有多強(qiáng)大? 微企點H5建站彰顯實力
公司網(wǎng)站建設(shè)應(yīng)避免陷入模仿誤區(qū)及仿站陷阱
企業(yè)網(wǎng)站定制開發(fā)五大類型,更專業(yè)的建站流程
滿足可用適用夠用三原則即可輕松選擇合適網(wǎng)站主機(jī)
評論(0人參與,0條評論)
發(fā)布評論
最新評論