我在 php 中找到了preg_split和分解函数,用于将空格分隔的字符串分解为单词。 它也非常有用。 但是我想做的下一步是删除重复的单词和[",",".以及其他一些标点符号]......
比如如果
"我爱尼泊尔。尼泊尔是一个内陆国家。尼泊尔在亚洲。
我只想在句子中获得独特的单词,例如:
我, 爱, 尼泊尔, 是, a, 内陆, 国家, 在, 亚洲
http://php.net/manual/en/function.array-unique.php
这应该只是完成工作:
$string = "I love nepal. Nepal is a landlocked country. Nepal is in Asia.";
$string = preg_replace( "/[^'w's]/", "", $string );
$words = array();
foreach ( explode( " ", $string ) AS $word ) {
$word = strtolower($word);
$words[$word] = 1;
}
$unique_words = array_keys( $words );