This repository is under construction and will be officially released by Mizuno group.
Please contact tadahaya[at]gmail.com before publishing your paper using the contents of this repository.
FDA@label のデータを処理したコードです。
- データ数は、220366 行です。
- 50000 行ごとに、45 個のファイルに分かれています。
- データは各医薬品ごとにまとまっています。
- テーブルは raw のみです。
- テーブルの構成の概要は、以下のとおりです:
- row_id:DB 内での通し番号(追加したもの)
- set_id:医薬品に対して一意に定まる ID
- id:ある医薬品の特定のバージョンに対して一意に定まる ID
- その他のカラム:医薬品の特徴など
- 列名の詳細の説明は ここ か fdalabel_columns.csv を参照してください。
- https://nctr-crs.fda.gov/fdalabel/services/spl/set-ids/{setid}/spl-doc を置き換えることで、該当する医薬品の添付文書を見ることができます。
- DAILYMED にある通り、
- https://dailymed.nlm.nih.gov/dailymed/drugInfo.cfm?setid={setid}&version={versionnumber} の置換により、特定のバージョンにアクセスすることもできます。
- labelling archives による検索で、過去のバージョンを探すこともできます。
- analysis:階層構造になっていたデータをフラット化し、データの中身を確認するのに使ったコードなどです。
- make_db:列を絞り、データベース形式にするのに使用したコードです。
- pubchem:PubChem から Active ingredients の情報を取ってくるのに使ったコードです。
- NAS の text 直下の fdalabel フォルダにあります。
- カラムの説明は fdalabel_columns.csv にまとまっています。
- Mei Yoshikawa
- main contributor
- Tadahaya Mizuno
- correspondence
If you have any questions or comments, please feel free to create an issue on github here, or email us:
- yoshikawa-mei2525[at]g.ecc.u-tokyo.ac.jp
- tadahaya[at]gmail.com
- lead contact