Last edit
Changed:
< * Разработка документации по использованию программному комплексу, включающей в себя администрирование программного комплекса, описание стандартных процедур, программного интерфейса, описание языка запросов и стандартных команд, а также описание расширяемости программного комплекса для разработчиков
to
> * Разработка документации по использованию программного комплекса, включающей в себя администрирование программного комплекса, описание стандартных процедур, программного интерфейса, описание языка запросов и стандартных команд, а также описание расширяемости программного комплекса для разработчиков
"Разработка программного обеспечения масштабируемого хранилища научных данных, ориентированное на эффективную работу с данными, полученных из сенсорных сетей и в результате компьютерного моделирования".
Мероприятие 2.1. "Формирование информационной инфраструктуры наноиндустрии"
Целью работы является разработка архитектуры и алгоритмов программного комплекса для эффективной работы с научными данными - хранение, доступ и анализ данных, полученных из сенсорных сетей и в результате компьютерного моделирования, нацеленный, в первую очередь, на использование в масштабируемых хранилищах коллективного использования научными коллективами в различных областях науки, требующих стандартизованного подхода к хранению очень больших массивов "сырых" данных и их последующей сложной обработки с возможностью работы с разными версиями научных данных для обеспечения воспроизводимости научных результатов, а также для обеспечения научного поиска в очень больших базах научных данных.
Задачи проекта:
Ожидаемые результаты проекта:
Прототип программного комплекса для масштабируемого хранилища данных, позволяющий многим группам исследователей, работающих в различных научных дисциплинах, эффективно хранить данные экспериментов и компьютерного моделирования, обрабатывать "сырые" данные и иметь доступ к различным версиям результатов этой обработки, проводить научные исследования с данными до сотен петабайтов, беспрепятственно обмениваться и использовать данные разных экспериментов, в том числе:
Результаты работ будут использоваться научными и инновационными центрами и университетами России, а также отдельными коллективами исследователей и разработчиков, ведущими научно-технические исследования и инновационные разработки в различных прикладных областях и требующие стандартизованного подхода к хранению, обработке и работе с коллекциями данных, требующих масштабируемого хранилища и параллельной обработки данных, а также научного поиска в очень больших базах научных данных.
Масштабирование программного комплекса на работу до 10x и 100x петабайт, от персонального ноутбука до большого кластера в 1000x серверов обеспечит научные коллективы большей однородностью в использовании ПО для работы данными.
Пользователи программного обеспечения получат возможность эффективной работы с "сырыми данными" с сохранением целостности данных, версионность результатов обработки "сырых" данных, что обеспечит воспроизводимость научных результатов, встроенную поддержку данных с погрешностями измерений, свободный обмен и работы с данными различных исследовательских групп. Фактически, пользователи получат полноценную поддержку полного цикла работы с научными данными - хранения "сырых" данных, их обработка ( возможно, переобработка для учета ошибок или новых знаний), хранения разных версий результатов обработки, и инструментарий для анализа данных.