五月婷婷欧美视频_少女频道在线观看高清_欧美日韩视频一区二区三区_7777精品伊久久久大香线蕉语言

首頁 > 機(jī)器人資訊 > 讓機(jī)器人替你聊天,還不被人看出破綻!如何訓(xùn)練一個克隆版的你?

讓機(jī)器人替你聊天,還不被人看出破綻!如何訓(xùn)練一個克隆版的你?

日期:2019-02-20   人氣:  來源:互聯(lián)網(wǎng)
簡介:讓機(jī)器人替你聊天,還不被人看出破綻!如何訓(xùn)練一個克隆版的你? 聊天機(jī)器人到底是什么呢?說白了,就是計算機(jī)程序通過聽覺或文本方法進(jìn)行對話。 當(dāng)今最流行的四個對話機(jī)器人是:蘋果的Siri、微軟Cortana、谷歌助理、亞馬遜的Alexa。他們能夠幫你查比分、……

讓機(jī)器人替你聊天,還不被人看出破綻!如何訓(xùn)練一個克隆版的你?

聊天機(jī)器人到底是什么呢?說白了,就是計算機(jī)程序通過聽覺或文本方法進(jìn)行對話。

當(dāng)今最流行的四個對話機(jī)器人是:蘋果的Siri、微軟Cortana、谷歌助理、亞馬遜的Alexa。他們能夠幫你查比分、打電話,當(dāng)然,偶爾他們也會出錯。

本文,我們主要會詳細(xì)介紹聊天機(jī)器人在文本方面的運作。

在這篇文章中,我們將看到如何使用深度學(xué)習(xí)模型訓(xùn)練聊天機(jī)器人用我們所希望的方式在社交媒體上進(jìn)行對話。

意圖&深度學(xué)習(xí)

如何訓(xùn)練一個高水平的聊天機(jī)器人呢?

高水平的工作聊天機(jī)器人是應(yīng)當(dāng)對任何給定的消息給予最佳反饋。這種最好的反應(yīng)應(yīng)該滿足以下要求:

回答對方問題

反饋相關(guān)信息

問后續(xù)問題或用現(xiàn)實方法繼續(xù)對話

這三個方面是機(jī)器人表現(xiàn)出來的內(nèi)容,而隱含其中沒有表現(xiàn)出來的則是一系列流程:理解發(fā)送者的意圖,確定反饋信息的類型(問一個后續(xù)問題,或者直接反應(yīng)等),并遵循正確的語法和詞法規(guī)則。

請注意,意圖二字至關(guān)重要。只有明確意圖,才能保證在后續(xù)流程的順利進(jìn)行。對于意圖,讀者通過本篇文章,將會看到,深度學(xué)習(xí)是最有效的解決意圖問題的方法之一。

深度學(xué)習(xí)的方法

聊天機(jī)器人使用的深度學(xué)習(xí)模型幾乎都是Seq2Seq。2014年,IlyaSutskever,OriolVinyals,andQuocLe發(fā)表了《SequencetoSequenceLearningwithNeuralNetworks》一文。摘要顯示,盡管機(jī)器翻譯已經(jīng)做的很好,但Seq2Seq卻模型能更好的完成各種各樣的NLP的任務(wù)。

Seq2Seq模型由兩個主要部件組成,一個是編碼器RNN,另一個是解碼器RNN。從高層次上來說,編碼器的工作是將輸入文本信息生成固定的表示。解碼器則是接收這個表示,并生成一個可變長度的文本,以響應(yīng)它。

讓我們來看看它是如何在更詳細(xì)的層次上工作的。

正如我們所熟知的,編碼器RNN包含了許多隱藏的狀態(tài)向量,它們每個都表示從上一次時間步驟中獲取的信息。例如,在第3步序中的隱藏狀態(tài)向量是前三個單詞的函數(shù)。通過這個邏輯,編碼器RNN的最終隱藏狀態(tài)向量可以被認(rèn)為是對整個輸入文本的一種相當(dāng)精確的表示。

而解碼器RNN負(fù)責(zé)接收編碼器的最后隱藏狀態(tài)向量,并使用它來預(yù)測輸出應(yīng)答的單詞。讓我們看看第一個單元。該單元的工作是使用向量表示v,并決定其詞匯表中哪個單詞是最適合輸出響應(yīng)的。從數(shù)學(xué)上講,這就意味著我們計算詞匯中的每一個單詞的概率,并選擇值的極大似然。

第二單元是向量表示v的函數(shù),也是先前單元的輸出。LSTM的目標(biāo)是估計以下條件概率。

讓我們來解構(gòu)這個方程式意味著什么。

左側(cè)指的是輸出序列的概率,這取決于給定輸入序列。

右側(cè)包含p(yt|v,y1,,yt),它是所有單詞的概率向量,條件是在前一步的向量表示和輸出的情況下。其中pi等價于西格瑪(或累計求和)的乘法。則右側(cè)可降為p(Y1|V)*p(y2|v,y1)*p(Y3|v,y1,y2)

在繼續(xù)之前,讓我們先做一個簡單的例子。

讓我們在第一張圖片中輸入文本:你明天有空嗎?

大多數(shù)人都會怎么回答呢?一般都會用yes、yeah、no開始。

在我們完成了網(wǎng)絡(luò)訓(xùn)練之后,概率p(Y1|V)將是一個類似于下面的分布。

再來看我們需要計算的第二個概率,p(y2|v,y1)表是一個函數(shù),詞的分布y1以及向量的表示結(jié)果v,而pi將產(chǎn)生最終結(jié)果并作為我們的最終反應(yīng)。

Seq2Seq模型的最重要特性之一是它提供的多功能性。當(dāng)你想到傳統(tǒng)的ML方法(線性回歸,庫卡機(jī)器人驅(qū)動器維修,支持向量機(jī))和深等深學(xué)習(xí)方法時,這些模型需要一個固定的大小輸入,并產(chǎn)生固定大小的輸出。

但是輸入的長度必須事先知道。這是對諸如機(jī)器翻譯、語音識別和問答等任務(wù)的一個很大的限制。這些任務(wù)我們都不知道輸入短語的大小,我們也希望能夠生成可變長度響應(yīng),而不僅僅局限于一個特定的輸出表示。而Seq2Seq模型允許這樣的靈活性!

自2014以來,Seq2Seq模型已經(jīng)有了很多改進(jìn),你可以在這篇文章結(jié)尾相關(guān)論文部分中閱讀更多關(guān)于Seq2Seq的文章。

數(shù)據(jù)集的選擇

在考慮將機(jī)器學(xué)習(xí)應(yīng)用于任何類型的任務(wù)時,我們需要做的第一件事都是選擇數(shù)據(jù)集,并對我們需要的模型進(jìn)行訓(xùn)練。對于序列模型,我們需要大量的會話日志。從高層次上講,這個編碼器-解碼器網(wǎng)絡(luò)需要能夠正確理解每個查詢(編碼器輸入)所期望的響應(yīng)類型(解碼器輸出)。

一些常見的數(shù)據(jù)集包括:康奈爾電影對話語料庫、ubuntu語料庫和微軟的社交媒體對話語料庫。

雖然大多數(shù)人都在訓(xùn)練聊天機(jī)器人來回答具體信息或提供某種服務(wù),但我更感興趣的是更多的有趣的應(yīng)用程序。有了這篇文章,我想看看我是否可以用我自己的生活中的對話日志來訓(xùn)練一個Seq2Seq的模型來學(xué)習(xí)對信息的反應(yīng)。

獲取數(shù)據(jù)

我們需要創(chuàng)建一個大量的對話數(shù)據(jù),在我的社交媒體上,我使用了Facebook、GoogleHangouts、SMS、Linkedin、Twitter、Tinder和Slack等著與人們保持聯(lián)系。

Facebook:這是大部分培訓(xùn)數(shù)據(jù)的來源。facebook有一個很酷的功能,讓你可以下載你所有的Facebook數(shù)據(jù)。包含所有的信息、照片、歷史信息。

Hangouts:您可以根據(jù)這個文章的指示來提取聊天數(shù)據(jù)

SMS:可以快速獲得所有之前的聊天記錄(sms備份+是一個不錯的應(yīng)用程序),但我很少使用短信。

Linkedin:Linkedin確實提供了一種工具,可以在這里獲取數(shù)據(jù)的歸檔。

Twitter:這其中沒有足夠的私人信息。

Tinder:這其中的對話不是數(shù)據(jù)集。

Slack:我的Slack剛剛開始使用,只有幾個私有消息,庫卡機(jī)器人,計劃手動復(fù)制。

創(chuàng)建數(shù)據(jù)集

數(shù)據(jù)集的創(chuàng)建是機(jī)器學(xué)習(xí)的一個重要組成部分,它涉及到數(shù)據(jù)集預(yù)處理。這些源數(shù)據(jù)存檔格式不同,并且包含我們不需要的部分(例如,fb數(shù)據(jù)的圖片部分)。

正如您所看到的,Hangouts數(shù)據(jù)的格式與facebook數(shù)據(jù)有一點不同,而linkedin的消息以csv格式進(jìn)行。我們的目標(biāo)是使用所有這些數(shù)據(jù)集來創(chuàng)建一個統(tǒng)一的文件,命名為(FRIENDS_MESSAGE,YOUR_RESPONSE)

為了做到這一點,我編寫了一個python腳本,可以在這里查看。

此腳本將創(chuàng)建兩個不同的文件。其中一個是Numpy對象(conversationDictionary.npy)包含所有輸入輸出對。另一個是一個大的txt文件(conversationData.txt)包含這些輸入輸出對的句子形式,一個對應(yīng)一個。通常,我喜歡共享數(shù)據(jù)集,但是對于這個特定的數(shù)據(jù)集,我會保持私有,因為它有大量的私人對話。這是最后一個數(shù)據(jù)集的快照。

詞向量

LOL,WTF,這些都是在我們的會話數(shù)據(jù)文件中經(jīng)常出現(xiàn)的所有單詞。雖然它們在社交媒體領(lǐng)域很常見,但它們并不是在很多傳統(tǒng)的數(shù)據(jù)集中。通常情況下,我在接近NLP任務(wù)時的第一個直覺是簡單地使用預(yù)先訓(xùn)練的向量,因為它們能在大型主體上進(jìn)行大量迭代的訓(xùn)練。

然而,由于我們有這么多的單詞和縮寫,而不是在典型的預(yù)先訓(xùn)練的單詞向量列表中,因此,生成我們自己的單詞向量對于確保單詞正確表達(dá)是至關(guān)重要的。

免責(zé)聲明:本網(wǎng)部分文章和信息來源于互聯(lián)網(wǎng),本網(wǎng)轉(zhuǎn)載出于傳遞更多信息和學(xué)習(xí)之目的。如轉(zhuǎn)載稿涉及版權(quán)等問題,請立即聯(lián)系網(wǎng)站所有人,我們會予以更改或刪除相關(guān)文章,保證您的權(quán)利。
五月婷婷欧美视频_少女频道在线观看高清_欧美日韩视频一区二区三区_7777精品伊久久久大香线蕉语言
在线欧美日韩精品| 欧美色涩在线第一页| 亚洲福利一区二区| 国模少妇一区二区三区| 在线观看av一区二区| 久久久久久久av麻豆果冻| 亚洲午夜私人影院| 97久久超碰国产精品电影| 国产婷婷色一区二区三区| 日韩一区欧美二区| 在线观看亚洲a| 136国产福利精品导航| 精品一区二区三区不卡 | 日韩成人伦理电影在线观看| ...av二区三区久久精品| 国产在线精品一区二区夜色| 欧美一区二区三区不卡| 亚洲成人av资源| 欧美日韩中文字幕一区| 亚洲午夜成aⅴ人片| 91理论电影在线观看| 国产精品欧美一区喷水| 国产99精品在线观看| 久久精品视频在线免费观看| 国产在线视视频有精品| 日韩精品一区在线| 青娱乐精品在线视频| 懂色av中文一区二区三区| 精品国产乱码久久久久久夜甘婷婷 | 国产欧美日韩麻豆91| 丰满白嫩尤物一区二区| 日本一区二区电影| 一本色道a无线码一区v| 亚洲激情六月丁香| 5月丁香婷婷综合| 韩国视频一区二区| 中文字幕亚洲区| 在线观看国产91| 五月激情综合网| 日韩一区二区高清| 国产福利精品导航| 亚洲最快最全在线视频| 欧美日本免费一区二区三区| 国产综合色视频| 国产精品毛片久久久久久| 在线免费观看成人短视频| 亚洲一区二区欧美| 欧美日韩一区不卡| 另类综合日韩欧美亚洲| 久久精品视频免费观看| 欧美色综合久久| 亚洲精品日日夜夜| 在线观看91av| 国产真实精品久久二三区| 亚洲免费成人av| 91精品婷婷国产综合久久竹菊| 韩国视频一区二区| 一区二区视频在线| 精品日韩一区二区三区免费视频| a亚洲天堂av| 亚洲图片欧美一区| 国产色91在线| 91精品国产综合久久久蜜臀图片| 男女性色大片免费观看一区二区 | 国内精品国产成人国产三级粉色| 亚洲精品免费电影| 久久中文娱乐网| 欧美视频中文字幕| 日韩国产欧美在线视频| 亚洲男人的天堂在线aⅴ视频| 日韩三级精品电影久久久| 91猫先生在线| 精品亚洲成a人在线观看| 亚洲另类在线制服丝袜| 国产色一区二区| 日韩欧美精品在线| 欧美怡红院视频| 成人av在线网| 国产精品影音先锋| 久久99精品久久久久久国产越南| 亚洲成人免费视频| 亚洲男人电影天堂| 18涩涩午夜精品.www| 国产欧美一区二区三区在线老狼| 日韩精品一区国产麻豆| 欧美大胆一级视频| 日韩欧美第一区| 日韩精品一区二区三区四区视频| 欧美日韩高清一区二区| 在线观看亚洲一区| 91黄色免费版| 欧美在线免费观看亚洲| 91国产福利在线| 在线观看区一区二| 欧美日韩国产综合视频在线观看 | 一区二区三区欧美日韩| 亚洲制服欧美中文字幕中文字幕| 亚洲女爱视频在线| 一区二区三区在线视频播放| 亚洲同性gay激情无套| 亚洲色图丝袜美腿| 亚洲视频免费看| 一区二区高清在线| 午夜精品免费在线| 亚洲超丰满肉感bbw| 日韩国产在线观看一区| 男男视频亚洲欧美| 懂色av一区二区夜夜嗨| av在线这里只有精品| 色婷婷综合久久久久中文 | 一区二区三区日本| 日韩二区三区四区| 蜜桃av噜噜一区| 国产成人8x视频一区二区| 99精品视频在线免费观看| 色噜噜狠狠成人中文综合| 欧美三区免费完整视频在线观看| 欧美精品在线视频| 精品国产91洋老外米糕| 国产精品电影一区二区| 亚洲福利电影网| 婷婷中文字幕综合| 人人超碰91尤物精品国产| 国产在线观看一区二区| 国产1区2区3区精品美女| 在线观看欧美精品| 久久中文字幕电影| 亚洲午夜国产一区99re久久| 久久国产精品72免费观看| 成人av影院在线| 欧美一二三在线| 亚洲欧美国产三级| 老司机免费视频一区二区三区| 成人中文字幕合集| 精品视频在线看| 久久久久九九视频| 爽爽淫人综合网网站| 成人av在线网站| 精品久久99ma| 一区二区欧美国产| 国产iv一区二区三区| 日韩一级精品视频在线观看| 久久久久久久久久久久久久久99 | 日韩一区二区精品| 一区二区在线观看不卡| 东方欧美亚洲色图在线| 日韩视频在线观看一区二区| 亚洲精品国产品国语在线app| 国产精品自拍三区| 91精品国产综合久久国产大片| 国产精品的网站| 国产女同互慰高潮91漫画| 国产一区二区三区| 日韩一区二区三区四区| 一区二区激情视频| 不卡高清视频专区| 久久夜色精品一区| 麻豆成人在线观看| 337p亚洲精品色噜噜噜| 亚洲一二三四久久| 紧缚奴在线一区二区三区| 欧美手机在线视频| 亚洲一区二区三区视频在线播放| 91福利国产精品| 亚洲精选视频在线| 色偷偷久久一区二区三区| 国产女同互慰高潮91漫画| 国内精品伊人久久久久av影院 | 亚洲高清免费视频| 色综合久久99| 亚洲免费高清视频在线| a亚洲天堂av| 亚洲国产欧美一区二区三区丁香婷| 97se亚洲国产综合在线| 国产日本亚洲高清| 风间由美一区二区三区在线观看| 国产三级精品三级在线专区| 丁香婷婷综合色啪| 亚洲视频免费观看| 欧美在线观看视频在线| 日韩国产欧美一区二区三区| 精品欧美一区二区三区精品久久| 国产一区二区三区国产| 中文字幕不卡在线观看| 91免费精品国自产拍在线不卡| 国产精品久久久久7777按摩| 91亚洲精品久久久蜜桃网站| 亚洲午夜日本在线观看| 日韩一本二本av| 国v精品久久久网| 亚洲欧美国产高清| 宅男在线国产精品| 国产精品一区免费视频| 国产精品视频免费| 色婷婷久久久久swag精品| 亚洲激情图片qvod| 制服丝袜av成人在线看| 国产精品一区免费在线观看| 亚洲日本在线a| 欧美大尺度电影在线|