網站資訊 news
您現在的位置:首頁 > 網站資訊 > 中文分詞
NEWS

新聞資訊

中文分詞

發布時間:2017/03/08 網站資訊 瀏覽次數:771

昆山網站建設

中文與英文有著很大的不同,因此,在中文搜索引擎上市之后,百度曾經發布過一個視宣傳自己,具體可以點擊:百度更懂中文

我們來看杜牧的一首詩《清明》
清明時節雨紛紛,路上行人欲斷魂。借問酒家何處有,牧童遙指杏花村。
改變標點符號(其實就是改變分詞),就會把原詩變成一首小令:
清明時節雨。紛紛路上行人,欲斷魂。 借問酒家何處?有牧童遙指,杏花村。
那么我們再換一種標點方法,它甚至可以變成一出「小戲劇」!
清明時節。
雨紛紛。
路上。
行人(欲斷魂):借問酒家何處有?
牧童(遙指):杏花村。

分詞是中文搜索引擎特有的技術。因為在英文中以單詞為單位,單詞之間會有空格,并且每個單詞都有特定的意思,一詞一義,計算機很容易理解語句的意思。但中文就不是這樣了,中文只有把一句話中所有的字串聯起來才能表達一個完整的意思,串聯的方法不一樣,意思就可能不一樣,所以計算機不能直接把中文分成單個單個的字來理解,因此,引入了中文分詞技術,把一句話切分成一個個有意義的詞語來進行理解。比如,”我是一個搜索技術愛好者“,就可以切分成:”我/是/一個/搜索/技術/愛好者“來理解。

搜索引擎面對中文網頁時,靠中文分詞來理解網頁所描述的內容。通常情況下,搜索引擎會使用自己特有的海量詞庫來對網頁內容進行拆分,或者通過詞庫對內容進行機械分割,統計出現的次數最多的詞,使搜索引擎明白該網頁是跟什么內容相關的,從而使該網頁在什么樣的關鍵詞搜索中獲得排序。

SEO工作者應當深入去體會理解搜索引擎對于自己所關注的關鍵詞是如何分詞的,這樣,對于工作就會有很強的指導意義。

云風網絡是集昆山網站制作,昆山網頁設計,昆山網站推廣于一體的昆山網絡公司,業務涵蓋:昆山手機網站制作,昆山網站設計,昆山網絡建設,昆山做網站,昆山網站建設,電話:13912673321

相關推薦
點擊這里給我發消息 技術咨詢
回到頂部
双色球在线自动选号