Перейти к публикации
Форум химиков на XuMuK.ru

Покритикуйте, пожалуйста, нашу бесплатную базу на пол миллиарда конформеров


Рекомендованные сообщения

Решение задач, рефераты, курсовые - онлайн сервис помощи учащимся. Цены в 2-3 раза ниже!

Встроили отображение расстояний между атомами, обычные и торсионные углы. Также добавили набор радикалов (предварительный).

 

Рассмотрим пример, допустим мы хотим посмотреть сорбозу, у нее формула C6H12O6, записываем ее в поле  Empirical Formula with Ranges, вспоминаем, что в ней есть C=O  группы и -[CH(OH)]4-, отмечаем ниже поля CO и [C(O)]4 для этих функциональных групп в формате SMARTS - SMILES и получаем довольно небольшой набор молекул, которые подходят под критерий нашего поиска.

 

На 5-ом месте как раз расположилась наша искомая сорбоза. Кликаем на 2D -> Conformer#1 и маркируем двойными щелчками последовательно до 4-х атомов. Внизу под молекулой отображается длина связей, углы и торсионные углы.

 

При переходе от одного к другому конформеру эти величины меняются в соответствии с номером конформера.

Ссылка на сообщение

Не хватает поиска по названиям и синонимам.

Формулы под структурами не записаны в стандартной нотации Хилла. Это немного путает. Да и правильное оформление надстрочными и подстрочными знаками сделало бы внешний вид формулы более красивым.

Нет синонимов под структурами - это не дает провести поиск по странице результатов средствами браузера.

Было бы удобно, сразу видеть есть у формулы конформеры или нет (например, цветовым выделением), а не перебирать их все.

 

Сорбозу по вашей инструкции так и не нашел 😞

А для перекиси водорода и воды не нашел углов или длин связей.

Ссылка на сообщение

Спасибо большое, chemister2010 за отзыв!

 

С названиями и синонимами - сложно, будем думать, будем ли мы это делать или нет, у нас названия запрятаны в самом конце индексации и, часто названия из PubChem какие-то очень не адекватные, поэтому мы на них индексацию забили.

 

32 минуты назад, chemister2010 сказал:

Формулы под структурами не записаны в стандартной нотации Хилла. Это немного путает. Да и правильное оформление надстрочными и подстрочными знаками сделало бы внешний вид формулы более красивым.

спасибо, да, это легко исправить, на днях сделаем!

 

32 минуты назад, chemister2010 сказал:

Нет синонимов под структурами - это не дает провести поиск по странице результатов средствами браузера.

Синонимов - в смысле схожих молекул? Если да, то тут надо по-другому поступать. Надо выбрать чекбокс под молекулой, для которой Вы хотите найти аналог, и подняться выше и выбрать Refine Search, попопутно выбрав удаление водородов или игнорирование типов связей.

 

Также мы сейчас перестраиваем базу, чтобы на одну картинку попадали все стереоизомеры и все изотопные изомеры. Иначе иногда даже изотопных изомеров в нашей базе оказывается под сотню и их очень не удобно все пролистывать. На днях будет... сейчас на это все индексация строится, просто это неделю по времени занимает.

 

32 минуты назад, chemister2010 сказал:

Сорбозу по вашей инструкции так и не нашел 😞

 

Странно, только что проверил - пятая структура.

 

32 минуты назад, chemister2010 сказал:

А для перекиси водорода и воды не нашел углов или длин связей.

Должно находиться, вот как у меня выглядел поиск перекиси водорода: и результат был вторым в таком поиске.

 

Углы (95.91 и 95.60) слегка не симметричны в пределах расчетной погрешности, только что проверил - там до градуса изменение этого угла дает меньше изменение общей энергии, чем изменение на 0.1 градуса по торсионному углу. Точность сходимости у нас около 0.005-0.01Ангстрем по координатам, ибо точнее уже без очень недетских ab initio не вытянуть.

a1.png

a2.png

Изменено пользователем igorchem
Ссылка на сообщение

Ой, только сейчас заметил, что у нас по-разному сортируется набор молекул во время отображения. Зафиксил, чтобы всегда было одинаково. Сейчас при поиске выше сорбоза в списке на 8-м месте. Есть довольно большая проблема с аналогичными названиями, сорбоза в нашей базе фигурирует по ее ИЮПАКовскому названию, то есть как 1,3,4,5,6-pentahydroxyhexan-2-one

Ссылка на сообщение
2 часа назад, igorchem сказал:

сорбоза в нашей базе фигурирует по ее ИЮПАКовскому названию, то есть как 1,3,4,5,6-pentahydroxyhexan-2-one

 

1,3,4,5,6-pentahydroxyhexan-2-one - это не сорбоза, хотя сорбоза - это 1,3,4,5,6-pentahydroxyhexan-2-one.

Ссылка на сообщение

Хорошее дело делаете, спасибо!

Не сразу разобрался, потому, как закончите допиливать, жду мини-туториал.

Углы и связи, как по мне, не очень информативно сделаны. Я бы сделал в 3d, так же как это реализовано в chemcraft или avogadro, в отдельном html, там бы и свойства все написал, и чтобы скачать свойства можно было, в .json, например. 

Примерно так будет:

http://www.aflowlib.org/search/advanced.php

https://materials.nrel.gov/queryStd

И отдельная просьба по данным есть. Можете выкладывать для DFT полную энергию системы и силы? Это нужно для машинного обучения потенциалов атомов в мол. динамике.

Изменено пользователем Trepetsky
Ссылка на сообщение

Спасибо большое за отзыв!

 

9 часов назад, Trepetsky сказал:

Углы и связи, как по мне, не очень информативно сделаны.

Согласен! На данный момент уже запланировано:

1. прикрутить WebGL и рисовать 3Д в виде объемных шариков, или шариков и палочек (типа chemcraft но с тенями и перспективой), вне браузера на OpenGL это уже работает, но пока в базу не встроили.

2. переключать несколько молекул (стереоизомеров и изотопных изомеров) на одной картинке,

3. опционально переключать очень схожие молекулы внутри одной картинки, как сейчас реализовано переключение конформеров. Например один и тот же лиганд + все катионы, сейчас оно все валится в разные картинки, а по сути там обычно схожие конформеры и их идеологически правильно смотреть вместе друг с другом.

 

Сразу каждую молекулу в отдельный фрейм выводить не хотелось бы, хотя конечно для каждой найденной молекулы можно опционально выводить ее отдельно.

 

9 часов назад, Trepetsky сказал:

И отдельная просьба по данным есть. Можете выкладывать для DFT полную энергию системы и силы? Это нужно для машинного обучения потенциалов атомов в мол. динамике.

 

Да, обязательно! Эти величины внутри базы конечно имеются, но они просто еще не попали на экран :)

 

Мы машинным обучением в мол-динамике тоже грешим - это одна из целей построения такой базы.

 

9 часов назад, Trepetsky сказал:

Не сразу разобрался, потому, как закончите допиливать, жду мини-туториал.

верно, допиливаем, туториал обязательно сделаем, зачатки его уже имеются, если нажать кнопку с вопросом в верхнем правом углу

Ссылка на сообщение
  • 3 месяца спустя...

Добавили объединение всех конформеров, стерео-, диастерео- и изотопных изомеров в единую молекулярную структуру и упростили поиск по радикалам.

 

Добавили возможность

 

1. сохранить полную информацию о выбранном конформере и его изотопном изомере в MOL файл, и

2. сохранить полный поиск в виде отдельного статического html, со встроенным визуализатором, чтобы этот файл можно было скачать и использовать не зависимо от нашей базы.

 

Современная прямая ссылка: https://www.elegant-nmr.com/mdb.html?rm

 

PS: пара мелких багов пока еще, к сожалению, присутствует (у симметрично расположенных атомов иногда путается индекс, и в названии часто добавляется в конце лишняя буква), но баги будут вскорости исправлены.

 

С радостью выслушаю и учту Ваши советы и критику!

Ссылка на сообщение
43 минуты назад, igorchem сказал:

Добавили объединение всех конформеров, стерео-, диастерео- и изотопных изомеров в единую молекулярную структуру и упростили поиск по радикалам.

 

Добавили возможность

 

1. сохранить полную информацию о выбранном конформере и его изотопном изомере в MOL файл, и

2. сохранить полный поиск в виде отдельного статического html, со встроенным визуализатором, чтобы этот файл можно было скачать и использовать не зависимо от нашей базы.

 

Современная прямая ссылка: https://www.elegant-nmr.com/mdb.html?rm

 

PS: пара мелких багов пока еще, к сожалению, присутствует (у симметрично расположенных атомов иногда путается индекс, и в названии часто добавляется в конце лишняя буква), но баги будут вскорости исправлены.

 

С радостью выслушаю и учту Ваши советы и критику!

1026296094_.png.2349000961d6b05a91d1aaa58cd9b450.png

Отличная база данных! Ходить на нее я пожалуй не буду.

Ссылка на сообщение
15 минут назад, Вадим Вергун сказал:

1026296094_.png.2349000961d6b05a91d1aaa58cd9b450.png

Отличная база данных! Ходить на нее я пожалуй не буду.

 

 

Да, айпишники ФСБ и КГБ у нас блокируются, вы же еще в декабре с такой же проблемой сталкивались, остальные - ходят без проблем.

 

Ссылка на сообщение

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.
Примечание: вашему сообщению потребуется утверждение модератора, прежде чем оно станет доступным.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

Загрузка...
  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.

×
×
  • Создать...
Яндекс.Метрика