日本語KWIC索引生成ソフトウェア KWIC



概要

 日本語のテキストファイルから語句を検索し、結果をソートされたKWIC索引の形式で出力します。

 最新バージョンはKWIC 2.00です。(2015/5/22)

  [ お知らせ ]
  ◇ KWICマニュアルを微調整しました。(2018/5/3) New!
   (一部の表現を調整し、緑色にしていた文字を黒に戻しただけで、内容上の実質的な変更はありません。)
  ◇ 青空文庫のデータを作り直してアップロードしました。(2017/4/30)
  ◇ 擬似正規表現を拡張しました。(2015/5/22)
  ◇ KWICマニュアルを全面的に再構成し、コマンドプロンプトでの用法の学習を不要にしました。(2015/5/17)
  ◇ KWICマニュアルにWindows 8/8.1でのインストール方法などを加筆しました。(2015/5/13)
  ◇ 検索文字列の列幅の微調整を可能にしました。(2013/10/16)
  ◇ BCCWJ-DVD版のテキストを検索できるようになりました。こちらをご覧ください。(2012/8/16)
  ◇ 用例の原文テキストを簡単に参照できるようになりました。こちらをご覧ください。(2012/8/8)
  • 本ソフトウェアは無保証です。自己責任でご使用ください。
  • 本ソフトウェアはエクセルのインストールされたWindows上で動作します。作成とメインの動作確認は日本語版Windows XP+Excel 2003で行い、Windows Vista/7/8/10、Excel 2007/2010/2013/2016の環境でも動作を確認しています。
  • 英語、簡体中文、繁体中文(台湾)の各版のWindowsでの動作も確認し、ロシア語のWindowsでも動作すると聞きました。ただし、日本語版以外のWindowsの場合はこちらの手順に従って設定を行う必要があります。また、環境によってはJapanese Language Packの追加を要する可能性があります。
  • 本ソフトウェアの作成にはRuby 1.8.7(http://www.ruby-lang.org/)とExerb 5.3.0(http://exerb.sourceforge.jp/)を使用させていただいています。
  • 最新版をこのサイトでのみ公開しています。改変・転載・再配布等はご遠慮ください。

特徴

 本ソフトウェアは、『コーパス日本語学ガイドブック』のために作成し同書の添付CD-ROMに収めたKWIC索引生成ソフトウェアに改良を加えたもので、次のような特徴があります。

   ○任意のテキストをそのまま検索することができる。
   ○テキストが桁折りされていても(=改行をまたいだ語句も)検索できる。
   ○指定のディレクトリ(複数可)に含まれるすべてまたは一部のテキストを一括して検索する。
   ○複数の検索条件を記述したファイルに基づいて一気にまとめて検索できる。
   ○検索文字列に加えて前後の文脈の条件を指定可能で、いずれにも正規表現が使える。
   ○仮名1文字、漢字1文字、特定の五段活用動詞の全活用形といった条件を簡単に指定できる。
   ○用例は前後の文脈などに従ってソートした形で出力する。
   ○検索結果をエクセルファイルの形で出力し、自動的にエクセルで開くことができる。

  


インストール

 次のリンクをクリックし、表示されるダイアログで[実行]を選択すると、KWICのインストール先を聞いてきます。環境によって[実行]ボタンが出ない場合は、まずファイルをディスク上に保存し、それをダブルクリックして実行します。(実行時、セキュリティの警告には「実行する」や「はい」などで応じてください。)入力欄にあらかじめ"C:¥KWIC"(=ドライブCのルートディレクトリのKWICというディレクトリ)と表示されているので、それでよければそのまま[OK]ボタンを押します。それ以外の場所にしたければドライブ名・ディレクトリ名を書き換えて[OK]ボタンを押します(非推奨)。これにより、関連ファイル一式が指定の場所にコピーされます(処理は1秒程度で終わります)。(インストール後に「このプログラムは正しくインストールされなかった可能性があります」というメッセージが出ることがありますが、問題なくインストールされています。「このプログラムは正しくインストールされました」で応じてください。)

   KWICのインストール

  • リンクをクリックした後の手順はブラウザの種類やバージョンによって異なる可能性があります。また、最近のブラウザやセキュリティソフトはソフトをスムーズにインストールさせてくれません。問題がある場合は最後の注を見てください。
  • 更新の場合は、リンクをクリックした後、上書きの確認に対して「はい」で応じてください。ただし、KWIC.defについては、内容を変更して使用している場合は「いいえ」で応じてください。
  • こちらをクリックして[実行]を選べば青空文庫所収の文学作品約800点をハードディスクにコピーすることができます。最後の注に書いた方法も使えます。なお、日本語版以外のWindowsの場合は本ページの冒頭で説明している設定を事前に行ってください。
  • KWIC、青空文庫の作品ともに、アンインストールはインストールしたフォルダを内容ごと消すだけです。
  • セキュリティ関係の干渉によってKWIC、青空文庫の作品をインストールできない場合などのために、ZIP形式のデータも準備しました。KWICはこちら、青空文庫の作品はこちらからZIPファイルをダウンロードし、C:\(=ドライブCのルートフォルダ)に解凍してください。“書庫のフォルダを復元する”という条件で解凍します。

用法

 KWICの用法については次のマニュアルをご覧ください(pdfファイル、別ウィンドウで開きます)。

   KWICマニュアル(2015年全面改訂版)

   (参考資料)
   正規表現・文字コードの解説(旧版)
   コマンドプロンプトの解説

  • 最近のパソコンでは環境によって、KWIC.htaを実行したとき、ウィンドウが小さくて内容の一部がはみ出る、また、文字が小さくて読みにくいという問題が生じることがあるようです。その問題は以下の方法によって解消することができます。まず、メモ帳(Notepad)でC:\KWIC\KWIC.htaを開きます(インストール先を変えた場合は指定を適宜変更します)。ウィンドウを大きくするには、20行目にあるresizeTo(570, 315);の数字を大きくします。2つの数はウィンドウの横、縦の幅を表しています。また、文字を大きくするには、9行目にある14pxと13行目にある16pxの数値14、13の値を適宜大きくします。9行目では一般の表示、10行目では入力窓での文字のサイズを指定します。KWICマニュアルの5ページにある画像のような状態にしてください。 New!

拙作関連ソフトウェア

 日本語KWIC索引生成ソフトウェア KWIC 任意の日本語テキストから語句を検索し、KWIC索引を生成
 KWIC索引のソート sortKWIC KWIC索引をソート
 KWIC索引の原文参照 Source Text Retriever   KWIC索引の用例の原文テキストを参照
 KWIC索引の引用 quoteKWIC KWIC索引の用例を論文などへの引用に適した体裁でWordに格納
 BCCWJ N-gram分析 BNAnalyzer 中納言の検索結果に基づいて表現の共起傾向を分析
 BCCWJテキスト抽出 bccwj2text BCCWJ-DVD版からコーパス全サンプルのテキストを抽出
 日本語用例検索サイト 青空文庫所収の文学作品約3,400件から日本語の用例を検索
 日本語研究文献検索サイト 日本語研究文献を検索し、結果を見やすい書式で出力
 文献ソートサイト 文献リストを著者名または刊行年に基づいて並べ替える
 例文番号の付け直し Renumber 言語学の論文の例文番号を付け直す(Word用)


改訂履歴

■KWIC
1.00 ガイドブック添付CD-ROM所収版(2007/9/7)
1.10 定義ファイルの名前に全角文字を使用可能に(2007/9/12)
1.20 KWIC.exeの名前を変更可能に(2008/1/30)
1.30 高速化(最大で従来の8倍に)(2008/8/17)
1.40 定義ファイルの「パス=~」の指定方法を拡張(2009/2/13)
1.50 検索結果のタブ区切り形式出力機能を追加(2009/8/4)
1.60 検索結果のエクセルファイル出力機能を追加(2011/10/15)
1.70 定義ファイルの「パス=~」の指定方法を拡張(2012/8/18)
1.80 台湾繁体版Windowsにおける問題を解決(2013/6/8)
1.90 Excel 2013の環境における問題を解決(2013/6/26)
2.00 擬似正規表現を拡張、その他の小改良(2015/5/22)

■RunKWIC
1.00 ガイドブック添付CD-ROM所収版(2007/9/7)
2.00 新規に作り直し(2007/9/11)
2.01 「全用例表示」チェックボックスを追加(2009/8/4)
2.02 「参照」ボタンと「ヘルプ」リンクの追加など(2009/8/21)
2.03 「!」指定時の処理方法を改善(2012/7/10)
2.04 RunKWICがまれに大きなウィンドウで開く現象を解消(2012/8/8)
2.05 URLの変更でヘルプのリンクが無効になっていたのを修正(2012/9/13)
2.06 Windows 7での表示が不完全になる問題ほかを修正(2013/5/14)
2.00 KWICに改称し、バージョン番号をKWIC本体と共通化(2015/5/22)
  • 環境やデータによって処理が正しく行われない場合、可能であればソフトウェアを修正します。問題を再現できる小規模なデータがあればお送りください。その際、問題の内容に加え、処理の手順、Windows・エクセルの種類やバージョンなどもお知らせください。

 ソフトウェアのメニューに戻る