百度中文分詞
作者:徐小樣
瀏覽:1278次
發(fā)布時間:2017-05-22




首先根據(jù)分割符號將查詢分開,然后看看是否有重復(fù)的字符串,如果有,就拋棄多余的,只保留一個,接著判斷是否有英文或者數(shù)字,如果有的話,把英文或者數(shù)字當(dāng)作一個整體保留并把前后的中文切開。
如果字符串只包含小于等于3個中文字符的話,那就保留不動,當(dāng)字符串長度大于4個中文字符的時候,百度的分詞程序才出馬大干快上,把這個字符串肢解掉。