提供元

Thieme Publishing Group(日本販売代理店:株式会社紀伊國屋書店)
概要
ThiemeのScience of Synthesis (SOS)データセットは、Science of Synthesis(SOS)を機械可読式のデータセットに変換した商品です。
Science of Synthesis は、評価済み合成方法を収録した有機化学・有機金属化学分野における最大級のコレクションです。各分野の専門家によりキュレートされた、最適で信頼性の高い高品質な化学データを一貫したフォーマットでご提供しています。
Thieme は、このSOSデータを逆合成解析やフォワード反応予測のための AI モデルのトレーニングに利用可能な機械可読式のデータセットに変換しました。
詳細
SOS データセットは 47万件以上*の化学反応、230万以上の分子、2,400以上の PDF ファイル、6万件以上の実験手順を含む80,000以上の XML ファイルを含み、ダイレクトに運用可能な機械可読データ形式で提供されます。機械学習で高精度の予測や分析をするに当たり、質の高いデータセットは欠かせない存在です。SOSデータセットは、高品質で信頼性の高いデータを機械可読なデータ形式で提供するため、テキストデータマイニングに時間と費用をかける必要は無くなります。SOSデータセットは単独で使用することも、社内データや商用公開データなど他のデータと組み合わせて補完的に使うことも可能です。
*2024年10月時点
Science of Synthesisの収録内容
データセット化したScience of Synthesisでは、下記の内容を収録しています。
- Houben-Weyl Methods of Organic Chemistry シリーズ(1909年 – 2003年刊行)
- Science of Synthesis シリーズ(2000年 – 2010年刊行)
- Science of Synthesis Knowledge Updates(1990年 – 現在)
- Reference Library(スペシャルトピックス)シリーズ(1990年 – 現在)
コラボ事例
2021年、IBM ResearchはAIモデルを用いて化学反応の結果予測を支援するクラウドプラットフォーム「Molecular Transformer」へ、「Science of Synthesis」の合成データを搭載しました。
このIBM社 とのコラボプロジェクトでは、特許データにSOS データセットを組み合わせることで、IBMの化学反応予測AI モデルRXNの精度が、特許データのみのモデルと比較してフォワード反応予測で3倍、逆合成解析で9倍向上しました。
高精度の予測結果を得るには高品質なデータが不可欠であり、「Science of Synthesis」のデータのクオリティが高く評価されています。
詳細はプレスリリースをご参照ください。
ご契約形態・価格
価格は個別見積りです。
お近くの営業所、または弊社営業担当までお問い合わせください。
※SOSデータセットは、データセット全体としても、または関心分野に重点を置いたデータセットの一部のみでも、ニーズに合わせたパッケージでご提供が可能です。また、様々な活用事例に対応した柔軟な価格モデルをご用意しています。
お問い合わせ
本件についてのお問い合わせ、年間購読料のお見積りについては最寄りの紀伊國屋書店営業所もしくはこちらまでお願いいたします。
(雑誌部)