 |
VFP 愛用者社區 本討論區為 Visual Foxpro 愛用者經驗交流的地方, 請多多利用"搜尋"的功能, 先查看看有無前例可循, 如果還有不懂的再發問. 部份主題有附加檔案, 須先註冊成為社區居民才可以下載.
|
上一篇主題 :: 下一篇主題 |
發表人 |
內容 |
sky2046
註冊時間: 2005-02-03 文章: 14
第 1 樓
|
發表於: 星期四 四月 07, 2005 10:14 am 文章主題: 请问有人知道在vfp里怎样实现概念检索? |
|
|
我要做个基于概念检索的检索系统,但不知怎么才算是概念检索
网上查了下,概念检索要同义词,近义词,广义词都能检索
my god 看的我要疯了,不知给位高手有什么建议,请指教,谢了 _________________ FFXIII |
|
回頂端 |
|
 |
garfield Site Admin

註冊時間: 2003-01-30 文章: 2160
第 2 樓
|
發表於: 星期四 四月 07, 2005 8:31 pm 文章主題: |
|
|
這個題目可以當成畢業論文了....難.
因為書沒有讀過所以到google找了一下
******************************
還可申請專利耶, http://blue.lins.fju.edu.tw/~tseng/ResearchResults/keyword.htm
******************************
概念是反映對象的特有屬性的思維形式。
概念檢索即通過對文獻的原文信息進行語義上的自然語言處理,析取各種概念信息,並由此形成一個知識庫,然後根據對用戶提問的理解檢索知識庫中的相關信息以提供直接的回答。具體地說,概念檢索也就是:當使用某一檢索提問詞進行檢索時系統基於對概念內涵的理解以及用戶提交的關鍵詞所表達的概念(concept)作為搜索依據,能同時對該詞的同義詞、近義詞、廣義詞、狹義詞同樣進行檢索,選出與此概念相關的頁面,以達到擴大檢索、避免漏檢的目的。
概念檢索具有以下幾個特點:1、具有分析和理解自然語言的能力,可以對輸入的原文根據其概念內容進行組織和安排,以析出相關的概念信息和範疇知識。然後通過記憶機制將它們存儲到知識庫中,以備檢索用。2、記憶機制能夠自動補充和更新。3、具有用自然語言回答用戶提問的能力。
智能化的概念檢索突破了詞語機械匹配式局限於表面形式的缺陷,從詞所表達的概念意義層次上來認識和處理用戶的檢索請求。例如,當用戶使用「自行車」進行檢索時,檢索結果不僅包括「自行車」的內容,還包括「腳踏車」、「單車」等內容,大大提高了文獻的檢全率和檢准率。
(參見:徐海燕. 網上中文概念檢索系統. 情報雜誌,2003(1) )
***************************
概念檢索(Concept)基於自然語言的檢索機制
概念檢索(Concept Search)
概念檢索採用未組織的自然語言的檢索機制展開主題檢索。
CrossSearch 檢索結果被多個數據庫收錄的記錄會顯示各數據庫的連接按鈕,您可選擇並瀏覽全記錄。
如果您想瀏覽 BIOSIS的索引信息,點擊BIOSIS Previews 按鈕。
如果您對 Web of Science所提供的信息感興趣,點擊ISI Web of Science按鈕。結果按相關性排序。
要根據數據庫過濾結果,從下拉菜單中選擇數據庫然後點擊Go.
點擊Edit Search按鈕,修改您的檢索提問。
在概念檢索中以詞干形式搜索檢索詞,從而可找到一些標準的復數和單詞變形。
從 BIOSIS Previews, 您可直接瀏覽ISI Web of Science中所提供的引文信息.
返回 CrossSearch 結果列表,或仍在BIOSIS Previews中只檢索這一個數據庫。
相關性設置
相關性由兩個因素決定:
1. 記錄中是否包含所有您輸入的檢索詞。包含所有檢索詞的記錄比只包含一部分檢索詞的記錄,或只含有一個檢索詞的記錄相關性要高。切記有些普通的詞,如停詞是忽略不計的。
2. 您輸入的檢索詞是否經常出現在您檢索的數據庫中。出現頻率越低的檢索詞分配的權重因子越高。
在上例中, 「acupuncture」 在數據庫中出現的頻率比 「effects」低,其權重因子就更高一些。
在檢索提問中添加檢索詞或短語,編輯您的檢索提問改變檢索的時間段設置相關性( Relevance)。
百分數越高,相關性的標準越高,得到的結果數目可能越少。
注意:
最好在初次檢索時將相關性設為0,如果檢索得到的結果太多,再逐漸提高相關性。
表格檢索(Form Search)
. 與概念檢索不同,檢索詞不採用詞干形式,所以必須用截詞或通配符以找到檢索詞的不同變化形式。
. 檢索途徑由您選擇的數據庫決定。它只提供您所選擇進行交叉檢索的數據庫所共同具有的檢索途徑點擊 Change Products to Search,改變要檢索的數據庫
************
附錄 A-CrossSearch 概念檢索
概率邏輯
概念檢索採用概率檢索機制。
在概念檢索中您可使用自然語言的檢索策略,因為它能自動篩選出您的檢索提問中包含的停詞(stop words)、冠詞和其它常用的詞,從而只搜索關鍵概念詞。
相關性
在檢索盒中輸入檢索詞後,您可將相關性設置在某一個百分數。設置的百分數越高,相關性標准越高-檢索得到的結果數目越少。
相關性由兩個因素決定:
1. 記錄中是否包含所有您輸入的檢索詞。包含所有檢索詞的記錄比只包含一部分檢索詞的記錄,或只含有一個檢索詞的記錄相關性要高。切記有些普通的詞,如停詞是忽略不計的。
2. 您輸入的檢索詞是否經常出現在您檢索的數據庫中。 例如輸入xenon atom,最相關的檢索結果應同時包含xenon 和 atom。因為單詞xenon 出現頻率比atom要低,因此次相關應是含有xenon而不是atom的記錄。相關性最低的是含有atom的記錄。
檢索詞的詞干變化
在概念檢索中檢索詞變會自動化為詞干形式,從而找到複數和詞的變形。
但如果檢索詞的變化會有不同的拼寫方法,或可用一個或兩個單詞表示,您應選擇表格檢索選項,在您的檢索提問中包含各種變化形式,例如:
進行 ultrasound wastewater treatment 的檢索會找到有關用超聲技術處理廢水的記錄。但使用檢索詞ultrasound不會自動找到含有ultrasonic的記錄。
同樣wastewater 也不會匹配 waste water.要找到各種變化形式,進入表格檢索, 在主題(Topic)檢索途徑中輸入 (ultrasound ORultrasonic) AND (waste water* OR wastewater*) 。 _________________ 利用>>搜尋<<的功能會比問的還要快得到答案. |
|
回頂端 |
|
 |
|
|
您 無法 在這個版面發表文章 您 無法 在這個版面回覆文章 您 無法 在這個版面編輯文章 您 無法 在這個版面刪除文章 您 無法 在這個版面進行投票 您 無法 在這個版面附加檔案 您 無法 在這個版面下載檔案
|
|