Hyper Collocation とは?
arXivに収録されている 811,761報の 英語論文から,例文を検索するための検索エンジンです.前後の語の頻度でソートして結果を返すので典型的な用法の例文を得ることができ,コロケーション辞書のように利用できます.
Springer Exemplar やライフサイエンス辞書の不足を補う個人用のツールとして開発してきましたが,サーバーの維持費が勿体ないので公開することにしました. 英語論文の執筆などのアカデミックライティングで適切な語順や表現に迷った際にご活用ください.
使用例
News
- サーバーを AWS から移行しました.
維持費が大幅に下がり(0.152→約0.018USD/時間),バックエンドをシャード化した全文索引で再構築したことで,今後は最新のシャードのみを作り直して論文を追加できるようになりました.検索対象データ(811,761報)に変更はありません. (2026/6/18) - サーバーを r4.large インスタンスから r5.large インスタンスに移行しました.
維持費が安く(0.16→0.152USD/時間),処理がわずかに速くなりました. (2018/9/29)
Tips
- 検索クエリ中の空白は有効です.したがって “word” と “␣word␣” は異なる結果を返します.
- 検索では大文字小文字が区別されます.
- 表示される例文はある程度ランダムに選ばれます.他の例文が見たいときはリロードしてください.また,検索結果のフレーズ部分をクリックすると,フレーズをクエリとして再検索を行うので,そのフレーズを含むさらに多くの例文が得られます.
- スニペット中の [Math] はその位置に別行立ての数式があったことを示しています.
プライバシーポリシー
- 本サイトは Cookie を使用せず,アクセス解析や広告などの第三者トラッキングも行いません.
- サービスの運用とセキュリティ確保のため,Webサーバーが標準的なアクセスログ(日時,リクエストされたURL,リファラ,ユーザーエージェント等)を記録します.IPアドレスは匿名化(末尾をマスク)して保存し,最長30日で削除します.これは GDPR 第6条(1)(f)(正当な利益)に基づき,運用・不正防止の目的にのみ利用します.
- サーバーはドイツ(Hetzner Online GmbH,EU圏内)に設置しています.取得した情報を販売・第三者へ提供することはありません.
- EU/EEA の居住者は,自己に関するデータへのアクセス・訂正・削除・処理への異議を申し立てる権利,および監督機関へ苦情を申し立てる権利を有します.お問い合わせは ichiro.maruta@gmail.com までご連絡ください.
謝辞
Hyper Collocation は多くのオープンソースソフトウェアやプロジェクトに依存しています.そのすべてを挙げることは困難ですが,特に Succinct Data Structure Library (SDSL), Pandoc, Crow, Vue.js, arXiv Bulk Full-Text Access を挙げて謝意を表します.