Перейти к публикации
Форум химиков на XuMuK.ru

Покритикуйте, пожалуйста, нашу бесплатную базу на пол миллиарда конформеров


Рекомендованные сообщения

Решение задач, рефераты, курсовые - онлайн сервис помощи учащимся. Цены в 2-3 раза ниже!

Ввел метилнитрат  CH3NO3.  

Это чудо выдало 22 молекулы!  21 из них абсолютно бредовые!

Может стоит заставить программку фильтровать базар? Например отслеживая наличие температур кипения-плавления, которые покажут, что это не фантазия или  интермедиат, а реально существующее вещество, которое можно в баночку сложить!

Ссылка на сообщение
3 часа назад, Arkadiy сказал:

Кривенько, открылось, но дальше ничего. Вопрос работает только первый с задержкой в 2-3 секунды

На запрос C18H36 выдало нечто фантастические из чистого углерода, целых 3 штуки1!!красиво, но бессмысленно

Спасибо большое за отзыв!

 

C18H36 в нашей базе встречается больше 1000 раз, надо бы как-то ограничить, чтобы найти что-то интересное. Например, Вы можете поискать только те, что содержат трехчленные циклы, в этом случае, во вспомогательном поиске выберете, пожалуйста, C3, а когда найдете трехчленный цикл (правда с двойными связями), Вы можете его импортировать в основной поиск предварительно нажав кнопку X - Bonds (чтобы двойные связи игнорировать).

 

Тогда во вспомогательном поиске появится еще 57449547B и поиск C18H36 стал существенно интереснее.

3 минуты назад, Arkadiy сказал:

Это чудо выдало 22 молекулы!  21 из них абсолютно бредовые!

Спасибо большое за отзыв! Согласен, там много молекул совсем не от мира сего.

 

Обычно, если для молекулы нет конформеров (под картинкой кнопка 2D не содержит ни одной записи Conformer #1...), то такие молекулы существуют или в виде интермедиатов, или на бумаге. Планирую на днях в первую очередь показывать то, что содержит конформеры, и только потом - все остальное.

Ссылка на сообщение
Только что, igorchem сказал:

Спасибо большое за отзыв!

 

C18H36 в нашей базе встречается больше 1000 раз, надо бы как-то ограничить, чтобы найти что-то интересное. Например, Вы можете поискать только те, что содержат трехчленные циклы, в этом случае, во вспомогательном поиске выберете, пожалуйста, C3, а когда найдете трехчленный цикл (правда с двойными связями), Вы можете его импортировать в основной поиск предварительно нажав кнопку X - Bonds (чтобы двойные связи игнорировать).

 

Тогда во вспомогательном поиске появится еще 57449547B и поиск C18H36 стал существенно интереснее.

Спасибо большое за отзыв! Согласен, там много молекул совсем не от мира сего.

 

Обычно, если для молекулы нет конформеров (под картинкой кнопка 2D не содержит ни одной записи Conformer #1...), то такие молекулы существуют или в виде интермедиатов, или на бумаге. Планирую на днях в первую очередь показывать то, что содержит конформеры, и только потом - все остальное.

Дело в том, что с точки зрения химика - органика выдается откровенный бред.

Поэтому этот бред нужно блокировать

Мне интересны РЕАЛЬНЫЕ молекулы, а не те, что кто-то придумал в пьяном бреду, а синтезировать не смог

Ссылка на сообщение
5 часов назад, chemister2010 сказал:

Не понял цели вашей базы данных.

Неудобно, что атомы в формуле нужно отделять пробелами.

В хелпе для Functional groups опечатка в первом слов

Спасибо большое за отзыв!

 

Пробелы убрали, теперь можно даже COOH написать, все должно работать,

опечатку исправил,

цель - сейчас мы планируем выполнять у себя большое число мол-механических и DFT расчетов и дополнять эту базу своими расчетами. Пока она базируется на PubChem.

 

Так как эти расчеты делаются для другого проекта, где эти расчеты в явную не видны, возникла идея выкладывать это все в открытую всем бесплатно, поэтому и возникла эта база.

 

На данный момент в базе есть быстрый поиск по нескольким фрагментам, что реализовано в auxilary search, вот как сделать это понятным для всех - это для меня сейчас основной вопрос, похоже я с первого раза не смог, но с Вашими советами, очень надеюсь, что получится.

Ссылка на сообщение
32 минуты назад, Arkadiy сказал:

Дело в том, что с точки зрения химика - органика выдается откровенный бред.

спасибо большое за отзыв! Да, полностью с Вами согласен, отключил пока отображение совсем не от мира сего структур, оставив только те, для которых есть конформеры. Хотя там всяко куча не реальных перекисей, которые только в жидком гелии живут, так и осталось, но, пока, по-другому, отсортировать не додумался.

  • Like 1
Ссылка на сообщение

Хорошо бы снабдить неким туториалом для освоения.   Интуитивно не все понятно.

Например, сразу же вместо "брутто-формулы" следует пункт "химические элементы", и это уже непонятно, о чем.

Поковыряться конечно интересно, но обычно ищут конкретную информацию, и можно утонуть в потоке.

Ссылка на сообщение

Спасибо большое, Jeffry, за отзыв!

 

Да, с брутто формулой - заумно получилось. Хотел указать, что тут можно ввести не только брутто-формулу, но также указать диапазоны значений для каждого элемента, то есть C12H22O11 - это просто брутто формула, а C12H20-20O11, это все с 12 углеродами, 11 кислородами и 20-22 водородами, а если поставить чекбокс - то и все остальные элементы, не указанные в брутто-формуле тоже допускаются.

 

Для более-менее больших молекул , где-то от 10 углеродов просто брутто формула даже с очень узкими диапазонами по массе и числу атомов - это уже тысячи и десятки тысяч молекул. Без вспомогательного поиска по радикалам и функциональным группам тут получается очень все не просто.

 

А вот вспомогательный поиск позволяет найти несколько групп и использовать их как составные части, то есть можно например, найти COOH, C6H5 и после этого искать все, что содержит оба таких радикала.

 

Таблица распространенных радикалов у меня уже есть, надеюсь ее встроить в этот поиск на днях.

Ссылка на сообщение
58 минут назад, igorchem сказал:

Спасибо большое, Jeffry, за отзыв!

Да, с брутто формулой - заумно получилось. Хотел указать, что тут можно ввести не только брутто-формулу, но также указать диапазоны значений для каждого элемента, то есть C12H22O11 - это просто брутто формула, а C12H20-20O11, это все с 12 углеродами, 11 кислородами и 20-22 водородами, а если поставить чекбокс - то и все остальные элементы, не указанные в брутто-формуле тоже допускаются.

Для более-менее больших молекул , где-то от 10 углеродов просто брутто формула даже с очень узкими диапазонами по массе и числу атомов - это уже тысячи и десятки тысяч молекул. Без вспомогательного поиска по радикалам и функциональным группам тут получается очень все не просто.

А вот вспомогательный поиск позволяет найти несколько групп и использовать их как составные части, то есть можно например, найти COOH, C6H5 и после этого искать все, что содержит оба таких радикала.

Таблица распространенных радикалов у меня уже есть, надеюсь ее встроить в этот поиск на днях.

Вы сильно недооцениваете число вариантов С10НхОу... уже у С10Н22 136 изомеров.

Изменено пользователем Максим0
Ссылка на сообщение
1 час назад, химхлам сказал:

Здесь нужна химическая СУБД типа ISISBASE, такое быстренько не слепишь, фирма MDL разрабатывала её много лет.

а я разве говорил, что быстренько слепили? Сравнение структур с почти линейной сложностью, индексация по простым радикалам, индексы по типам структур, быстрые алгоритмы слияния индексных таблиц, учет процессорных кешей, распараллеливание по всем ядрам сервера, на котором крутится, оно ж, как Вам должно быть понятно, не быстро программируется и действительно не каждый даже этими знаниями-то обладает, чтоб даже начать, не говоря уж о том, чтобы сделать.

 

Кстати, а об используемых алгоритмах в ISISBASE, набросайте, пожалуйста, doi или номерков патентов, любопытно будет почитать и понять чем мы лучше.

Ссылка на сообщение

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас
  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.

×
×
  • Создать...
Яндекс.Метрика