あいまい検索

医中誌Webでは、ひらがな・カタカナや旧字・新字、異体字などの表記の揺れを吸収するあいまい検索を行います。これにより、例えば 「頸椎」 「頚椎」 のどちらを入力しても、同じ結果を得ることができます。

ただし、異体字や機種依存文字は1文字1文字をすべて同一視しますが、「漢字とひらがな」 などは、あらかじめ医中誌データベースに登録した文字列に関してのみ同一視します。

例えば、「がん」 と 「癌」 を1文字単位で同一視するのではなく、「肺がん」 など登録されている文字列についてのみ、「肺がん」 と 「肺癌」 を同一視して検索します。これにより、適切な場合のみに表記の揺れを吸収した検索が行われます。

すべて同一視 = 異体字や機種依存文字

異体字の例




機種依存文字の例

I
II
III
(1)
(2)
(3)
cm
kg
Δ

登録された文字列のみ同一視

表記の揺れを適切に吸収して検索を行えるようにするため、以下の例のような文字列を登録しています。

パターン同一視する例
特定の用語の漢字・ひらがな・カタカナ肺がん 肺ガン 肺癌
タンパク質 蛋白質 たんぱく質
カタカナの異表記フォスファミド ホスファミド
旧字・新字総合臨床 綜合臨牀
検索例
「肺がん」 のあいまい検索
 「肺がん」 のあいまい検索
漢字・ひらがな・カタカナが同一視されます。
「がん」 ≠あいまい検索
 「がん」 のあいまい検索
「がん」 は登録されておらず、同一視されません。

上の例では、検索履歴は (肺腫瘍/TH or 肺がん/AL) と表示されますが、実際には(肺腫瘍/TH or (肺がん/AL or 肺ガン/AL or 肺癌/AL))として検索が行われます。