一種中文字向量學(xué)習(xí)方法及裝置
2021-09-17

本申請(qǐng)?zhí)峁┝艘环N中文字向量學(xué)習(xí)方法及裝置,該方法包括:將中文詞語(yǔ)庫(kù)中的詞進(jìn)行拆分,得到待學(xué)習(xí)漢字,并將所述待學(xué)習(xí)漢字存入漢字庫(kù);根據(jù)所述中文詞語(yǔ)庫(kù)和漢字庫(kù),統(tǒng)計(jì)每個(gè)待學(xué)習(xí)漢字在所述中文詞語(yǔ)庫(kù)中的構(gòu)詞數(shù),以及每個(gè)待學(xué)習(xí)漢字在每個(gè)詞中的使用頻次;針對(duì)每個(gè)待學(xué)習(xí)漢字,根據(jù)該待學(xué)習(xí)漢字對(duì)應(yīng)的構(gòu)詞數(shù),計(jì)算該待學(xué)習(xí)漢字對(duì)應(yīng)的反詞語(yǔ)頻率;根據(jù)所述每個(gè)待學(xué)習(xí)漢字在每個(gè)詞中的使用頻次和每個(gè)待學(xué)習(xí)漢字的反詞語(yǔ)頻率進(jìn)行加權(quán)計(jì)算,得到每個(gè)待學(xué)習(xí)漢字的字向量。
一種中文字向量學(xué)習(xí)方法,其特征在于,包括:將中文詞語(yǔ)庫(kù)中的詞進(jìn)行拆分,得到待學(xué)習(xí)漢字,并將所述待學(xué)習(xí)漢字存入漢字庫(kù);根據(jù)所述中文詞語(yǔ)庫(kù)和漢字庫(kù),統(tǒng)計(jì)每個(gè)待學(xué)習(xí)漢字在所述中文詞語(yǔ)庫(kù)中的構(gòu)詞數(shù),以及每個(gè)待學(xué)習(xí)漢字在每個(gè)詞中的使用頻次;針對(duì)每個(gè)待學(xué)習(xí)漢字,根據(jù)該待學(xué)習(xí)漢字對(duì)應(yīng)的構(gòu)詞數(shù),計(jì)算該待學(xué)習(xí)漢字對(duì)應(yīng)的反詞語(yǔ)頻率;根據(jù)所述每個(gè)待學(xué)習(xí)漢字在每個(gè)詞中的使用頻次、每個(gè)待學(xué)習(xí)漢字的反詞語(yǔ)頻率和每個(gè)詞對(duì)應(yīng)的詞向量進(jìn)行加權(quán)計(jì)算,得到每個(gè)待學(xué)習(xí)漢字的字向量。

申請(qǐng)?zhí)枺篊N202110645779.2
申請(qǐng)(專利權(quán))人:北京明略軟件系統(tǒng)有限公司
公開日期(公開):2021.07.09
公開日期(授權(quán)):2021.09.17
信息填寫