国产日产欧产美韩系列麻豆,最全的欧美大片,日本hiphop大师yokoi,巜人妻私密按摩师3


查辭海

 部首檢索 拼音檢索 近義詞 反義詞 語造
詞頻相關組詞:

字詞聯想測驗 敦煌曲子詞 懷古詞 一闕詞 疑問代名詞 臘鼓頻催 補詞 狀詞 指稱詞 賺詞 疑問代詞 沒詞兒 片面之詞 表詞 頻尿 截止頻率 寬頻 同形詞 加詞 不定冠詞 唸唸有詞 抽象名詞 頻率響應 及物動詞 根詞 供詞 高頻 發端詞 對口詞 調頻廣播 大唐秦王詞話 詞學 詞族 詞翰 詞窮 詞不悉心 詞頻 詞華 詞譜 詞林 搊彈詞 聲頻 蘇州彈詞 浮詞曲說 音頻 外交詞令 用詞 調詞架訟 詞無枝葉 詞窮理絕 詞窮理盡 包攬詞訟 專有名詞 自動頻率控制 常用詞 聽不得一面之詞 敬詞 張大其詞 情詞懇切 諷詞 合成詞 頻仍 支吾其詞 構詞惑眾 大張其詞 答詞 詩詞歌賦 狀聲詞 涯詞 空間頻率 各執一詞 慢詞 變頻 詞賦 連接詞 宮詞 調頻 廣告詞 古語詞 冠詞 唱詞 發刊詞 音譯詞 超頻 博學宏詞科 彈詞 措詞 生詞 歌詞 博學鴻詞科 詞藻 疊詞 太平歌詞 連詞 經傳釋詞 貶義詞 理屈詞窮 冗詞贅句 含糊其詞 虛詞 

詞頻基本信息介紹

   簡體: 詞頻
   繁體: 詞頻
   拼音: ci pin
   讀音: cí pín
   英語: term frequency
   近義詞: 
   反義詞: 
   單字解釋: 
   造句: 詞頻造句
   組詞,組成語: 

詞頻解釋

詞頻是什么意思詞義解釋來源:辭書


1:詞頻(term frequency簡稱TF)是指文件中詞匯出現的頻率或是次數是衡量一個詞匯重要性的一種指標。在各種資訊檢索模型中如向量空間模型、機率模型、語言模型都會用到詞頻的概念。一般而言一個詞匯在某一篇文件中出現的次數越高即詞頻越高則其在該篇文件中的代表性越重要。例外的情況有虛詞、連接詞、代名詞等功能詞(function words)這些詞匯經常有高詞頻卻不帶有任何內容意義在文件的詞匯處理過程常被特意地停用、過濾掉因而被稱為停用詞(stop words)。此外詞匯的重要性也會考慮到這個詞匯出現在所有文件中的篇數亦即其文件篇數(document frequency簡稱DF)。若其出現在越多篇文件中即DF越高則表示該詞匯可能為常用字故而重要性越低相對于其反向文件篇數(inverse document frequency簡稱IDF)也低。例如在一批有關電腦的文件中搜尋電腦這個詞匯幾乎所有的文件都會被找回則不管其詞頻(TF)電腦在這批文獻中對檢索沒有幫助其重要性要降低剛好對應到其IDF也低。因此詞匯的重要性經常以詞頻(TF)以及反向文件篇數(IDF)這兩個概念一起考慮。真正在應用詞頻的概念時常會對詞頻做轉換而獲得一個重要性數值。例如詞匯A與詞匯B在某一篇文件中各出現TF(A)=8次與TF(B)=2次但不代表詞匯A的重要性是詞匯B的8/2=4倍。常用的轉換作法有取對數函數如log2( TF(A) ) = log2(8) = 3log2( TF(B) ) = log2(2) = 1如此詞匯A的重要性只比詞匯B多3倍。此外還有對文件內所有的詞匯頻率做正規化處理例如TF(A)除以該文件所有詞匯的總詞頻(等于詞匯A的出現機率)詞匯的重要性從頻率的次數分布變成詞匯的出現機率分布如此可以在機率的理論中探討詞匯與文件的各種特性。





查辭海 chacihai.com 浙ICP備19001761號-4
主站蜘蛛池模板: 潜江市| 肥西县| 镇坪县| 焦作市| 九龙坡区| 阳朔县| 忻城县| 安顺市| 忻城县| 平果县| 周至县| 娱乐| 广水市| 平利县| 禹州市| 白银市| 宾阳县| 林甸县| 西华县| 通州市| 金沙县| 黄梅县| 涿州市| 运城市| 永泰县| 雅安市| 海南省| 山阴县| 文登市| 札达县| 望谟县| 建宁县| 个旧市| 兴文县| 洪江市| 许昌县| 泉州市| 资阳市| 东城区| 英吉沙县| 巴彦淖尔市|