Hyper Collocation とは?

arXivに収録されている 811,761報英語論文から,入力された英単語やフレーズを検索し,前後に頻出する単語の集計と使用箇所からの例文の抽出を行うサービスです.数学・物理・コンピュータサイエンスの分野を中心に多くの論文を収録した arXiv に基づいているので,これらの分野に特化したコロケーション辞書のように利用することが可能です.

Springer Exemplar やライフサイエンス辞書の不足を補う個人用のツールとして開発してきましたが,サーバーの維持費が勿体ないので公開することにしました. 英語論文の執筆などのアカデミックライティングで適切な語順や表現に迷った際にご活用ください.

使用例

Tips

  • 検索クエリ中の空白は有効です.したがって “word”“␣word␣” は異なる結果を返します.
  • 検索では大文字小文字が区別されます.
  • 表示される例文はある程度ランダムに選ばれます.他の例文が見たいときはリロードしてください.また,検索結果のフレーズ部分をクリックすると,フレーズをクエリとして再検索を行うので,そのフレーズを含むさらに多くの例文が得られます.
  • スニペット中の [Math] はその位置に別行立ての数式があったことを示しています.

謝辞

Hyper Collocation は多くのオープンソースソフトウェアやプロジェクトに依存しています.そのすべてを挙げることは困難ですが,特に Succinct Data Structure Library (SDSL)PandocCrowVue.jsarXiv Bulk Full-Text Access を挙げて謝意を表します.

{{result.occs}} occurrences of *{{result.query|visws}}* found. detail

Searched phrases cover {{result.coverage}} ({{result.coverage/result.occs | percent}}). Largest missing phrase may have {{result.largest_remaining}}({{result.largest_remaining/result.occs | percent}}) occurences.

Listed
Not Listed
Confident
Not confident
Not Listed

Ranking

Some low frequency (p < {{result.largest_remaining/result.occs | percent}}) phrases will be missing. The following ranking is inaccurate.
{{snippet.pre|nobr}}{{phrase.fix|nobr}}
{{result.query|nobr}}{{phrase.fix|nobr}}{{snippet.post|nobr}}
Loading...

Now Searching...

please wait for a while.