понедельник, 13 февраля 2012 г.

О базах данных и людях, их создающих

Я по образованию биолог, точнее, генетик, но сейчас в основном занимаюсь обработкой данных, можно сказать, биоинформатикой. Понадобилось мне скачать данные по изменчивости генома человека, доступные из проекта под названием 1000 человеческих геномов. (надо было назвать 1001, было бы лучше). Где-то 30-40 миллионов известных вариантов, с частотами. Ну, естественно, пошел на сайт проекта.

Самый свежий релиз/набор данных известен под именем Октябрь 2011. Его тогда и выпустили. Так вот ссылка на сайте идет на директорию 20110521 (май 2011), и конечно же, майский выпуск данных тоже был. А в названии файлов присутствует 20101123. Ага, 2010 год, ноябрь. Именно этот набор (Ноябрь 2010) я сейчас и использую, вместе с майским от 2011. На сайте так же указана дата создания файлов: декабрь 2011. Ну и файле README написано, что данные по инделам пока можно использовать на свой страх и риск. 

Комментариев нет:

Отправить комментарий