Skip to content

mizuno-group/fdalabel_handler

Repository files navigation

fdalabel_handler

Note

This repository is under construction and will be officially released by Mizuno group.
Please contact tadahaya[at]gmail.com before publishing your paper using the contents of this repository.

これはなに

FDA@label のデータを処理したコードです。

データの概要

データ数

  • データ数は、220366 行です。
  • 50000 行ごとに、45 個のファイルに分かれています。

データベースの構成

  • データは各医薬品ごとにまとまっています。
  • テーブルは raw のみです。
  • テーブルの構成の概要は、以下のとおりです:
    • row_id:DB 内での通し番号(追加したもの)
    • set_id:医薬品に対して一意に定まる ID
    • id:ある医薬品の特定のバージョンに対して一意に定まる ID
    • その他のカラム:医薬品の特徴など
  • 列名の詳細の説明は ここ か fdalabel_columns.csv を参照してください。

set_id について

コードの概要

  • analysis:階層構造になっていたデータをフラット化し、データの中身を確認するのに使ったコードなどです。
  • make_db:列を絞り、データベース形式にするのに使用したコードです。
  • pubchem:PubChem から Active ingredients の情報を取ってくるのに使ったコードです。

データの保管場所

  • NAS の text 直下の fdalabel フォルダにあります。
  • カラムの説明は fdalabel_columns.csv にまとまっています。

Authors

Contact

If you have any questions or comments, please feel free to create an issue on github here, or email us:

  • yoshikawa-mei2525[at]g.ecc.u-tokyo.ac.jp
  • tadahaya[at]gmail.com
    • lead contact

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published