為什麼越像人的自然語言互動工具，越容易讓人失望？

從有了 Siri 作為先例，擬人化已經成為了自然語言互動工具的必備能力。不論是服務於個人使用者的 AI 語音助手，還是企業提供的智慧型客服，甚至是各種有語音功能的家用電器，都要做 IP、造人設，幾乎有了成精之勢。

在大多數時候，我們認為自然語言互動的工具的擬人化可以降低使用者的「恐怖谷效應」，讓使用者更喜歡與其交流。但最新的研究結果卻表明，事實或許並非如此。

成為人類的千重套路

首先我們可以來看看，自然語言互動工具擬人化的「標準流程」。

第一步，給自己起一個人畜無害的名字。

我們常說，當你撿到一隻小動物後，如果給它起了名字，那麼它十有八九會成為你的寵物。AI 也是一樣，當自然語言互動工具擁有姓名，基本就注定了它會在成精的道路上越走越遠。自然語言互動工具的名字通常是「小」字輩，既顯得弱小無害又無關性別足夠政治正確。

第二步，利用語音產生技術模仿人類語氣。

擁有了名字之後，肯定就不能再用冷冰冰的電子音了，甚至以往語音產生技術管用的真人錄音+規則匹配的模式也略顯死板。這時便出現了以Google WaveNet 為代表的神經網路語音產生，透過對真人說話方式多種特徵的抓取，對語義、詞性、語法包括上下文等等參數綜合考慮，最終產生Google助手那樣像真人一樣說話會停頓、有思考的語氣。

第三步，讓對話內容更加人性化。

在自然語言互動的過程中，語音產生需要建立在文本內容之上。滿足了「說話語氣」的擬人化，同樣也要讓「說話內容」更加人性化。這時語義理解、多輪對話、自然語言產生等等技術的成熟度就變得非常重要。例如微軟在微軟小冰上應用的全雙工自然語言互動，就能實現「邊聽邊想」和「節奏控制」——透過整個對話過程對使用者意圖進行理解，減少使用者的等待時間，並且能夠主動引發新話題打破沉默，自行調節回答的內容和時機。這樣的對話內容透過語音產生技術「展現」出來，就可以以假亂真，讓人以為自己真的在和人類對話。

最後一步，披上「人皮」。

除了技術之外，還要以一些外圍模式讓自然語言互動工具更加擬人化。比如為它們設計一個可愛的卡通形象，增加幾條指令讓它們學會一些撒嬌賣萌的口頭語，在互動介面上增加一些細節讓人們意識不到他們在與機器對話等等。

有了這幾步套路，基本就能塑造出一個「化作人形」的自然語言互動工具了。

越人性越可愛？自然語言互動工具的期望值管理

可我們從未想過的一個問題是，在實際應用時，自然語言互動工具真的越擬人化越好嗎？最近賓州州立大學媒體效果研究實驗室就進行了這樣一項實驗。

研究人員們告知志願者，他們將在電商平台中選購數位相機，並需要和線上客服交談諮詢。這些客服背後都是智慧自然語言互動系統，但研究人員對其進行人性化和回應程度上的區分。不同組的志願者們分別會接觸不同的線上客服系統，有在對話時直接告知對方自己是機器客服的，有的只展示出對話框內容，有的會透過真人頭像和名字「偽裝」成人類。

同時這些擬人程度不同的智慧型客服，又分別有著不同的回應程度。有些可以迅速精準的回答使用者問題，有的卻聽不懂人話顧左右而言他。

在互動過後調查實驗者的滿意程度時，結果卻令人意外。

在一般的邏輯中，我們會認為智慧型客服在互動時響應程度越高，人們的滿意度自然也會越高。可實際情況是，在同樣的響應程度下，使用者的滿意程度是與智慧型客服的人性化程度相關的。比如同樣的互動內容，明確知道對方是機器客服的實驗者就會給出 80 分的滿意度評價，而那些偽裝成人類的機器客服卻只能獲得 60 分的滿意度評價。原因是當機器客服表現出較高的人性化特徵時，使用者對他們的期望程度也會隨著上升，盼望著他們能和人類一樣幫助自己解決問題，如果得不到想要的答案，則會放大失望感。

其實在我們自己應用自然語言互動時也有同樣的感受，當語音助手、智慧型客服等等產品不能解決問題還要強行賣萌講笑話時，我們的暴躁指數往往會呈直線上升。

說到底，自然語言互動的人性化與否是一個「使用者期望值管理」問題，有時過度提升使用者期望值反而會弄巧成拙。