提供元
センゲージ・ラーニング社Gale
概要
Galeの社データベースの歴史的な一次資料を提供するデータベース収録コンテンツのデータを、オンライン上で直感的にテキストマイニングを行うことができるプラットフォームです。
特徴
- 歴史分野で定評のあるGale のアーカイブ・コンテンツをコーパスとするテキストマイニングをオンライン上で、手軽に行うことができます。
- お手持ちのコンテンツをアップロードし、テキストマイニングを行うことも可能です。テキストマイニングを行うための許諾は、ご利用者ご自身で行ってください。
- 作成した分析結果の共有、履歴の保存や修正などもクラウド上で行うことができます。
- デジタル人文学的手法に興味がありながらも、技術面の抵抗から躊躇してきた研究者や、院生・学部生を含め、テキストマイニングの裾野をいっそう広げる可能性を秘めています。
- データ形式がすでに統一されており、定評あるオープンソース・ツールを多く採用し、OCR テキストのダウンロードも可能にしているため、すでにデジタル人文学を実践している研究者も、Gale コンテンツを用いた分析への糸口として利用することができます。
分析ツール
デジタル人文学の研究者によるフィードバックをもとに、テキストマイニングで広く使われている、汎用性の高いツールを採用しました。
Gale Digital Scholar Lab 内では、マウスのクリックや簡単な設定で実行できるように工夫されており、プログラミング等の知識は必要ありません。
- N グラム頻度(Ngram)
- 元となるライブラリ:Lucene
- 主な用途:頻出単語・フレーズの抽出
- 出力形式:ワードクラウド、棒グラフ、表形式
- トピック・モデリング(Topic Modelling)
- 元となるライブラリ:Mallet
- 主な用途:複数の文書に共通するトピック群の抽出
- 出力形式: 円形表示、矩形表示、ネットワーク表示、表形式
- クラスタリング(Clustering)
- 元となるライブラリ:SciKit Learn
- 主な用途:文書を類縁性で分類
- 出力形式:座標形式、表形式
- 固有表現抽出(Named Entity Recognition)
- 元となるライブラリ:spaCy
- 主な用途:固有名詞・数字・日付等の抽出
- 出力形式:階層表示形式、表形式
- 感情分析(Sentiment Analysis)
- 元となるライブラリ:OpenNLP
- 主な用途:文書内容が肯定的か否定的かを分析
- 出力形式:年代別グラフ形式、表形式
- 品詞タグ付け(Parts-of-Speech Tagger)
- 元となるライブラリ:spaCy
- 主な用途:著者ごとに品詞の使用頻度を比較
- 出力形式:著者別グラフ形式、表形式
対象データベース
Gale Digital Scholar Lab では、歴史的な一次資料を提供するGale Primary Sourcesシリーズのデータベースの コンテンツのデータをご利用いただくことができます。
ご利用いただけるのは、対象データベースのうちご購入いただいているコンテンツのみとなります。対象データベースはお問い合わせください。
ご契約形態・価格
- 教育機関等、法人向けサービスです。
- 年間購読でのご提供となります。
対象データベースのいずれかをご購入いただいているお客様がご契約いただけます。
- 在籍者数(常勤教員・ 院生・学部生の総数)により価格が異なります。
- 同時アクセス数は無制限です。
※個別にお見積申し上げます。紀伊國屋書店までお申しつけください。
認証方式
IPアドレス認証
その他の認証方式については、お問い合わせください。
トライアル
法人のお客様は、1ヶ月間のトライアルが可能です。最寄りの営業部・所、もしくは、こちらからお問い合わせください。
関連記事のご案内
(デジタル情報営業部)