本ページは作成中です。
次の図は,『青空文庫』サンプルから「これ」を検索した結果です。この検索結果から,さまざまな頻度を計測してみます。
頻度の計測は,列を指定して行います。例えば,「タイトル」列のいずれかのセルを選択し,右クリック⇒「統計」を実行すると(左図),作品ごとの「これ」の出現頻度を計測することができます(右図)。
正規表現置換により,集計結果を編集することができます。
ここでは,年月日表示から年表示にする例を示します。使用した資料は,国会会議録パッケージです。例えば,この処理により,年ごとの集計が容易になります。
まず,「開催年月日」列のセルを右クリックし,「置換」を実行します(左図)。置換の設定は,置換元(正規表現),置換先を指定します(図中央)。この場合,「-」以降の文字列を削除することにより,年表示にしています。右図が結果です。
置換の処理は,Javaの String#replaceAllで行っています。後方参照についても利用可能です。