第60回 人工知能学会 分子生物情報研究会(SIG-MBI)

第60回 人工知能学会 分子生物情報研究会(SIG-MBI)(第20回オープンバイオ研究会と共催)(第45回 情報処理学会 バイオ情報学研究会と連続開催)

日時:2016年3月17日(木) 14:00より
18日(金) 13:00まで(予定)

場所:北陸先端科学技術大学院大学(JAIST) 知識科学研究科講義棟2F中講義室

内容:特にテーマを限りませんので、奮って御応募下さい。

初日の発表希望者は、概要を以下の様式で佐藤 (ken@t.kanazawa-u.ac.jp) までお送り下さい。

著者(講演者に◯)、所属
代表者の連絡先
講演タイトル
講演概要(数行程度)
希望講演時間(分)

★ Subject: には必ず「発表希望」と御書き下さい。★

採択およびプログラム編成は世話人に御一任下さい。

例年と異り、今回は同じ場所で3つの研究会を連続して開催します。オープンバイオ研究会は
3月17日(木)に、分子生物情報研究会は3月18日(金)に、バイオ情報学研究会は3月
18日(金)から19日(土)にかけて開催します。2泊すれば3つの研究会に参加でき、基
礎から応用まで幅広い発表が聞けると思いますので、奮って御参加下さい。

また、この3つの研究会に先立ち、金沢市内にて3月14日(月)から16日(水)にかけて
ライフサイエンス統合データベースセンターの主催で「国内版バイオハッカソンBH15.15」が
開催され、その成果報告が3月17日(木)の午前中から午後にかけて同じ会場で発表される
予定です。

国内版バイオハッカソンBH15.15については参加登録が必要ですが、分子生物情報研究会、オープンバイオ研究会、およびバイオ情報学研究会は、参加費や登録は不要です。

国内版バイオハッカソンBH15.15については、詳しくはhttp://wiki.lifesciencedb.jp/mw/BH15.15をご参照ください。

オープンバイオ研究会については、詳しくはhttp://open-bio.jp/?meeting20をご参照下さい。

バイオ情報学研究会については、詳しくはhttp://www.ipsj.or.jp/kenkyukai/event/bio45.htmlをご参照下さい。

JAISTへの道程:
http://www.jaist.ac.jp/general_info/access/

小松空港からJAISTへの移動について:

JAIST送迎車(上記URL参照)の利用を希望する方は、必ず下記の情報を佐藤までお知らせ下さい。
宿泊申込をされる方は、通信欄に書いて頂ければ結構です。
・利用する日
・飛行機の便名
・送迎車の便名(上記JAISTへの道程のページから辿れる送迎車運行表を参照)
・携帯電話の番号
但し、送迎車1便につき先着9名までなので、満席の場合はタクシー等に乗り合わせて
来て頂くことになります。タクシーに4人乗車すれば1人1500円程度で済みますので、
飛行機の便が確定している方は、事前に佐藤までメールでお知らせ下さい。同じ便に乗る方
同士で、互いに情報を交換できるように致します。

宿泊先:辰口温泉 まつさき旅館
〒923-1245 石川県能美市辰口町3-1 tel 0761-51-3111
注:宿泊料は約13000円です(朝夕食付き)。

宿泊の申し込みは終了しましたが、若干名なら予約可能ですので、世話人まで
御連絡下さい。

研究会のみ参加(講演宿泊共になし)の場合:無料。参加登録の必要もありません。
問い合わせ先(世話人): 佐藤賢二 ken@t.kanazawa-u.ac.jp
金沢大学 理工研究域 電子情報学系

プログラム
——————–
09:30-09:55
Molecular Kinetics Simulation: 運動する分子のボトムアップ的理解のために

◯小長谷明彦(東京工業大学大学院知能システム科学専攻)

原子間力相互作用に基づく分子動力学はこれまで、タンパク質の動的な形態変化しか扱えなかった。本講演では、微小管滑走実験を題材に、これまでアニメーションでしか扱えなかった大きな分子の運動を実時間でシミュレーションする方法論について紹介する。

——————–
09:55-10:20
クマムシゲノムに大規模な水平伝播は存在しない

◯荒川和晴(慶應義塾大学先端生命科学研究所)

昨年末、ノースキャロライナ大学のグループがドゥジャルダンヤマクマムシのドラフトゲノムをPNASに報告し、その中で、本種が実に全遺伝子の17.5%をも水平伝播によって獲得したという驚愕の結果を示した。一方、本論文の出版直後から多方面の研究者から本アセンブリーに大きな問題があり、水平伝播とされるものの多くの実態がコンタミネーションであることが明らかになりつつある。本講演では我々の持っているデータに基づくPNAS論文への反論を紹介する。

——————–
10:20-10:45
公共遺伝子発現データの再利用に向けた取り組み

◯坊農秀雅(ライフサイエンス統合データベースセンター)

遺伝子発現データのアーカイブとしてNCBI GEO(Gene Expression Omnibus)がよく知られているが、果たしてそこにすべての公共遺伝子発現データが含まれているのだろうか?次世代シークエンサーによる遺伝子発現定量法の普及に伴う諸事情に対処すべく現在取り組んでいる、公共遺伝子発現データベース目次について紹介する。

——————–
10:45-11:00
塩基組成に基づいたプラスミドの宿主域の予測
◯鈴木治夫(慶應義塾大学先端生命科学研究所)

細菌の薬剤耐性や病原性の獲得には、細菌間を移動する染色体外DNA(プラスミド)が関与する。細菌進化におけるプラスミドの重要性を理解するためには、プラスミドの宿主域を知る必要がある。プラスミドは、既知の宿主の染色体と塩基組成が類似しているので、過去に滞在した宿主の塩基組成を獲得したと考えられる。狭宿主域プラスミドは一部の細菌にだけ塩基組成が類似していたのに対し、広宿主域プラスミドは多様な細菌に塩基組成が類似していた。このことは、塩基組成からプラスミドの宿主域を予測できることを示唆する。
【参考文献】
– Suzuki H*, Brown CJ, Top EM. (*Corresponding author.) “Genomic Signature Analysis to Predict Plasmid Host Range”, Molecular Life Sciences, DOI 10.1007/978-1-4614-6436-5_574-1, Springer Science+Business Media New York 2014
– Suzuki H, Yano H, Brown CJ, Top EM. “Predicting plasmid promiscuity based on genomic signature”, J Bacteriol., vol.192, no.22, pp.6045-6055, Nov 2010
– Suzuki H, Sota M, Brown CJ, Top EM. “Using Mahalanobis distance to compare genomic signatures between bacterial plasmids and chromosomes”, Nucleic Acids Res., vol.36, no.22, pp.e147, Dec 2008

——————–
11:00-11:25
NBDC RDFポータルの紹介

◯川島秀一、片山俊明(ライフサイエンス統合データベースセンター)

NBDC/DBCLSは、多種多様な生命科学分野のデータを、自在に統合して利用できる様にすることが、今後の生命科学研究活動に対して大いに寄与すると考え、そのために必要な基盤データ整備や技術開発を行っている。そして基盤データ整備の一環として、特にNBDCの統合推進化プログラムに参画するグループに対しては、各グループが構築しているデータベースのRDF化を推奨してきた。異なるデータベースを適切にRDF化することで、少なくともデータフォーマットは統一されるので、最小限の手間でデータを統合して利用することができる。ただ、個々のグループがばらばらにRDFデータを公開しても、利用者が必要なデータを探し出すことは困難であり、また自前でデータを公開するサーバーを運用することができない場合もある。そういった問題を解決するために、NBDC/DBCLSは、国内で構築されたRDFデータを収集して公開するポータルサイト、NBDC RDFポータルを開発し、昨年12月から運用を開始している。本ポータルでRDFデータを一括して公開することで、国内外に対して国内で開発されているRDFデータの認知度を高める効果もあると考えている。また、DBCLSでは、生命科学データのRDF化を行う際に参照することで、より適切なRDFを構築できるようなガイドラインを構築している。本ポータルサイトに登録されたRDFデータの特徴として、本ガイドラインにできるだけ準拠するように、レビューを経たものだけで構成されている点があげられる。現在、RDFポータルでは、11のRDFデータ・セットに対して、RDFデータのダウンロードおよび、SPARQLエンドポイントのサービスを提供している。

——————–
11:25-11:50
既存RDBを効率的にRDF化する D2RQ Mapper

◯山本泰智、片山俊明(ライフサイエンス統合データベースセンター)

生命科学分野においては近年セマンティックウェブ技術に基づくResource Description Framework (RDF) を採用したデータセットの表現が行われつつある。RDFを用いることで様々なデータベースをマッシュアップしやすくなるが、現状では依然としてMySQLやPostgreSQLなどの関係データベース(RDB)に格納されている事例が多い。そこで、RDBを維持管理している主体が最小限の負担でRDFによるデータの公開も可能とする環境が構築されることが望ましい。関連既存ツールであるD2RQは、関係データベースはそのままに、それをRDFとしてアクセス可能にするもので、RDFの標準問い合わせ言語であるSPARQLにも対応している。しかし、D2RQの設定ファイルは独自の用語で記述する必要があり、その編集は容易ではないことから、DBCLSでは、誤りを減らし、効率良く設定ファイルを作成できるD2RQ Mapperと呼ばれるウェブアプリケーションを開発し運用している。本発表ではこのD2RQ Mapperを紹介したい。

——————–
11:50-12:15
これからのリファレンスゲノムはどうあるべきか

◯片山 俊明(ライフサイエンス統合データベースセンター)

ゲノム解読が始まって以来、各モデル生物でのリファレンスゲノムが科学研究の目的で提供・更新され、それに対して各研究コミュニティがゲノムアノテーションや解析を行うというモデルが広く運用されてきた。しかし近年、とくにヒトにおいて、大規模な個人ゲノム解読や、臓器・細胞・疾病などの様々なアスペクトでのシーケンシングが進むなか、単一のリファレンスゲノムとの比較だけでは変異解析やアノテーションの管理が難しい状況が出てきている。2013年に始まったGlobal Alliance for Gnomics and Health (GA4GH)ではヒトゲノムのリファレンスを少数の西洋人の代表配列ではなく、全ての人類の配列に基づくグラフとして扱う技術が提唱・開発されている。国内でも日本人ゲノムの利活用のためのデータベースやシステム開発が求められており、これらを包括的に扱うためにはリファレンス・ゲノム・グラフをベースにした新しいモデルを世界標準にしていく必要があると考えられる。リファレンス・ゲノムのグラフと、セマンティック・ウェブによる知識やアノテーションのグラフ、これら2つの技術を連携させ標準化することにより、データベースの共通化と解析ツールやワークフローなどの共有が促進され、トータルでの開発コストを抑えることができるだけでなく、将来的に他の生物種やメタゲノム解析などへのフィードバックも期待される。

——————–