一種構(gòu)詞緊密度確定方法、裝置、電子設(shè)備及存儲介質(zhì)
2021-09-17

本申請涉及一種構(gòu)詞緊密度確定方法、裝置、電子設(shè)備及存儲介質(zhì)。其中,方法包括:獲取目標(biāo)詞庫,其中,目標(biāo)詞庫中包括候選漢字和由候選漢字構(gòu)成的候選詞語;通過確定每個候選詞語中包括的候選漢字,來確定目標(biāo)詞庫對應(yīng)的共現(xiàn)關(guān)系;基于共現(xiàn)關(guān)系計算得到每兩個候選漢字之間的漢字間構(gòu)詞緊密度;基于共現(xiàn)關(guān)系計算得到每個候選漢字與每個候選詞語之間的字詞間構(gòu)詞緊密度。本申請不需要大規(guī)模訓(xùn)練數(shù)據(jù)集,只需基于目標(biāo)詞庫對應(yīng)的共現(xiàn)關(guān)系,即可快速確定出沒兩個候選漢字之間的漢字間構(gòu)詞緊密度,以及每個候選漢字與每個候選詞語之間的字詞間構(gòu)詞緊密度,便于后期計算得到每個候選漢字的字向量。
一種構(gòu)詞緊密度確定方法,其特征在于,包括:獲取目標(biāo)詞庫,其中,所述目標(biāo)詞庫中包括候選漢字和由所述候選漢字構(gòu)成的候選詞語;通過確定每個所述候選詞語中包括的所述候選漢字,來確定所述目標(biāo)詞庫對應(yīng)的共現(xiàn)關(guān)系,其中,所述共現(xiàn)關(guān)系用于指示所述候選漢字與其他候選漢字以及所述候選詞語中至少之一之間的構(gòu)詞關(guān)系;基于所述共現(xiàn)關(guān)系計算得到每兩個所述候選漢字之間的漢字間構(gòu)詞緊密度,其中,每兩個所述候選漢字之間的所述漢字間構(gòu)詞緊密度用于描述每兩個所述候選漢字在進(jìn)行構(gòu)詞時的相關(guān)性;基于所述共現(xiàn)關(guān)系計算得到每個所述候選漢字與每個所述候選詞語之間的字詞間構(gòu)詞緊密度,其中,所述字詞間構(gòu)詞緊密度用于描述所述字詞間構(gòu)詞緊密度對應(yīng)的所述候選漢字與所述候選詞語在進(jìn)行構(gòu)詞時的相關(guān)性。

申請?zhí)枺篊N202110636673.6
申請(專利權(quán))人:北京明略軟件系統(tǒng)有限公司
公開日期(公開):2021.09.03
公開日期(授權(quán)):2024.03.22
信息填寫