在製作NLP自動回答機械人中, 一個最重要的算法就是尋找出一個句子在另一個句子中相同的字數, 然後在從中對話資料庫中找出最接近的問題和回答.
例如: 當自動回答機械人被問到: how old are you?
而對話資料庫中有3句問題和回答:
how old am I?
how many years old are you Google?
how old are you?
怎樣找到最接近的句子? 就是要將問題句子柝出一個個英文單字, 然後逐一比對, 然後計算相同單字的字數.
p.s. 標點符號 '?' 不屬於 英文字串,不需要計算!
第一行是一句被問到的句子
第二行是一個正整數n, 表示跟著有n句對話資料庫中的問題
n行, 每行都是一個整數, 代表被問到的句子在每一個對話資料庫中, 對應問題內有多少個相同的相同單字的字數.
how old are you? 3 how old am I? how many years old are you Google? how old are you?
2 4 4
What is your name? 3 What is your name Siri? What's your name? My name is Peter.
4 3 2
ID | User | Problem | Subject | Hit | Post Date |
沒有發現任何「解題報告」 |