Перейти к содержанию
Форум химиков на XuMuK.ru

Покритикуйте, пожалуйста, нашу бесплатную базу на пол миллиарда конформеров


igorchem

Рекомендуемые сообщения

🚑 Решение задач, контроши, рефераты, курсовые и другое! Онлайн сервис помощи учащимся. Цены в 2-3 раза ниже!
20 минут назад, химхлам сказал:

Сейчас в этом направлении работает эта фирма: https://en.wikipedia.org/wiki/BIOVIA

Странно, что Вы с этого не начали, а вспоминали MDL.

 

21 минуту назад, химхлам сказал:

Обратите внимание на их бюджеты и численность персонала. Вы прямо таки гений, если хотите в одиночку их догнать и обогнать

То, что я на этом форуме здесь на всеобщее обозрение предоставил, не означает, что там, где я работаю, ресурсы по вычислительным алгоритмам недостаточные, чтобы создать адекватную поисковую систему.

 

Вас, кстати, это не интересовало, как собственно и алгоритмы поиска, которые мы используем. Не услышал от Вас адекватных вопросов в этом направлении.

 

То есть, из всей дискуссии с Вами, я вижу только одно - Вас почему-то очень покоробило и возмутило, что кто-то "новенький" на форуме предложил бесплатный продукт, который позволяет искать по огромной известной в мире базе (на данный момент это PubChem с пол-миллиарда конформеров + то, что мы уже успели домоделировать), и Вы, после этого, просто не разбираясь, решили высказать свое необоснованное фи, что де никто, кроме Вами сейчас известных фирм (которых Вы даже не сразу вспомнили) не может такое, и, вдобавок, бесплатно предложить. 

 

Давайте с Вами спор закончим ))) Вы даже сразу названия фирм в этой области сказать не можете, а темы о патентах и алгоритмах Вы намеренно игнорируете, очевидно, Вы не совсем хорошо в этих темах разбираетесь.

Ссылка на комментарий

Я химик, т.е. конечный пользователь информационных химических продуктов, и поверьте, меньше всего меня интересуют механизмы поиска и пр. заморочки их создателей–программистов. 

Просто не понравилась Ваша система поиска, которая выглядит, мягко говоря, непрофессионально, а я знаю что говорю, т.к. много лет пользуюсь профессиональными БД. Да и польза от этой БД нулевая, т.к. расчёт конформеров делают многие бесплатные программы, т.е. Ваша БД – фактически совсем ненужная таблица умножения чисел, которую заменит любой калькулятор, считай – не хочу. И тем более подчёркивать её бесплатность – совсем уж нелепость, даже если Вы будете рассказывать, что потратили много времени, кто ж Вам доктор.  

Ссылка на комментарий
29 минут назад, химхлам сказал:

Я химик, т.е. конечный пользователь информационных химических продуктов, и поверьте, меньше всего меня интересуют механизмы поиска и пр. заморочки их создателей–программистов. 

Все люди в нашей команде имеют химическое образование, я дополнительно еще математик. Многие из нашей команды кандидаты и доктора наук с большим опытом работы.

Вас, я вижу, сильно напрягло, что база делается для людей - я мечтал еще лет 30 назад, будучи студентом, иметь такую под рукой, и база будет распространяться бесплатно.  Ведь не каждый химик может позволить себе купить базы поиска.

 

Сейчас мы дорабатываем и пополняем программу. По откликам пользователей сделаем все, чтобы она работала хорошо, и люди были довольны.

 

Я понимаю Ваше настроение: многие новое и прорывное воспринимают всегда в штыки - это же классика жанра.

 

44 минуты назад, химхлам сказал:

Да и польза от этой БД нулевая, т.к. расчёт конформеров делают многие бесплатные программы, т.е. Ваша БД – фактически совсем ненужная таблица умножения чисел, которую заменит любой калькулятор, считай – не хочу.

Каждый человек, хоть как-то связанный с органикой, понимает на сколько важно иметь точное понимание пространственной структуры молекул, которые участвуют в синтезе, чтобы избежать стерических затруднений в реакциях или не сварить рацемат вместо хирально чистого вещества.

 

Наша база позволяет сразу взглянуть на все молекулы, которые органик планирует синтезировать.

 

Рассмотрим простой университетский пример. Мы хотим сварить хлорпроизводные кофеина, также хотелось бы иметь под рукой список таких хлорпроизводных с их пространственными структурами, плюс хотелось бы иметь ссылки на патенты и другую литературу об этом процессе.

 

Итак, во вспомогательном поиске у нас в базе вводим C8H10N4O2 и долистываем до кофеина. После этого, выбираем X Hydrogen, чтобы игнорировать водороды в следующем поиске. В этом случае, в строке Functional groups, у нас имеется магическая запись 2519H - чтобы был остов кофеина без водородов.

 

Далее выбираем в основном поиске C8-10 N4 Cl1-5 - то есть мы к остову кофеина без водородов до двух дополнительных атомов углерода готовы посмотреть, а также от одного до пяти атомов хлора мы тоже хотим увидеть.

 

Смело жмем на поиск и получаем набор известных на данный момент хлорпроизводных. Для каждого из которых мы можем выбрать (если есть в базе Pubchem) конформер и посмотреть на него, покрутить его в 3Д. Почитать по ссылке на PubChem кто и когда это патентовал, кто производит, кто продает.

 

К сожалению, Вы сильно ошиблись, недооценив сложность алгоритмов поиска. Если бы мы, как Вы смешно предположили, считали "на счетах", то Вам бы пришлось комбинаторным образом перебирать все структуры и считать конформеры, пусть с помощью Вашей бесплатной программы. При расчете Вы могли забыть что-то или просто не дождаться, пока Вы переберете сотни и тысячи этих конформеров. Они могут быстро считаться, но хотя бы минуту расчетов на простую молекулу без flexible bonds надо потратить, а обычно час на конформер может потребоваться, если у Вас в кустах нет суперкомпьютера.

 

В мною указанном выше примере перебирается больше тысячи таких конформеров! Органик не обязан знать все параметры настроек программ по квантовой механике и, если он сам, без помощи квантовика, это начнет делать, может лажа получиться.

 

Мы считаем, что наш удобный поиск - это будущее в органической химии, и с радостью учтем все советы по существу, что еще может дополнительно в поиске и в отображении результатов Вам быть интересно!

Ссылка на комментарий

Если Вы считаете, что совершили прорыв в области хим. информатики, то напишите статью, а не распинайтесь на форуме, где основной контингент – школьники и домашние химики, в основном двоечники.

Пока что я не увидел никаких преимуществ, зато неудобств тьма, видна рука дилетанта, а судя по наездам на критикующиъ и самовосхвалению, Вы ещё и воинствующий.

Просто проинсталируйте IsisBase (в сети можно найти крекнутую версию) и посмотрите как это делают профи, тогда и поговорим.

Ссылка на комментарий
51 минуту назад, химхлам сказал:

Если Вы считаете, что совершили прорыв в области хим. информатики, то напишите статью, а не распинайтесь на форуме, где основной контингент – школьники и домашние химики, в основном двоечники.

статьи, в том числе в Нейчере, да и и патенты у меня есть, удивительно, что Вы их еще не нашли, мой хирш пока только 11, а у Вас?

 

А на форуме есть живое общение, в том числе с теми, кто может и в штыки воспринимает, как Вы, например - или Вы тоже из тех, как Вы назвали, школьников и двоечников? Надеюсь, что нет, поэтому, надеюсь, что не зря распинаюсь )))

 

52 минуты назад, химхлам сказал:

Просто проинсталируйте IsisBase (в сети можно найти крекнутую версию) и посмотрите как это делают профи, тогда и поговорим.

А Вы точно уверенны, что без суперкомпьютерной версии IsisBase сможет проиндексировать пол миллиарда конформеров?

 

Вы хоть понимаете, сколько это информации? Пол миллиарда конформеров - при, в среднем, 50 атомах, и 3-х декартовых координатах - это уже 75 миллиардов чисел (в двойной точности это 600 Гигабайт), а к этому надо добавить еще много информации по структуре, типу атомов, которая еще примерно столько же занимает и про индексацию не забывайте, которая в большинстве баз еще удваивает размер.

 

Я вот сомневаюсь, в тех рекламах, что я находил об IsisBase, как-то даже про миллион молекул не говорят. Вот Вы про нее много говорили, значит, или она у Вас есть, или часто пользовались.  Сколько конкретно молекул и конформеров у Вас там было, давайте честно сравниваться?

 

Вы, кстати, наш поиск хоть раз попробовали или Вас тоже Роспотребнадзор не пускает? Так если не пробовали, зачем комментировать? А так бы повторили бы пример, что я написал выше, или придумали бы сами что-то для Вас интересное и выложили бы здесь свой опыт по использованию на всеобщее обсуждение!

Ссылка на комментарий

Если есть статьи, то приведите ссылки, только учтите, что имеете дело с химиками, а не программистами. Кстати, а чего это Вы послали на химический форум агитировать математика, а не химика, которых у Вас есть и которые, правда, почему–то не знают о фирме MDL и возможностях IsisBase? Рога и копыта с надутыми щеками?

Максимальный размер БД IsisBase ~100МБ, это примерно полмиллиона структур, для практикующего химика этого достаточно на всю жизнь и ещё много останется. Но если купить у фирмы IsisHost, работающий в паре с СУБД Oracle и спец. химическим картриджем, то можно создавать неограниченные БД.

Да, мне не понравилась Ваша БД (язык не поднимается так её называть), поэтому и критикую, обращая Ваше внимание на то, что вопрос давно и капитально разработан, а Вы предлагаете такой себе велосипедик, который может ездить только по парковым дорожкам, зато прикольно звенит.

Не понял что я должен для Вас тут выложить и зачем...

Изучайте IsisBase!

Ссылка на комментарий
1 час назад, химхлам сказал:

Если есть статьи, то приведите ссылки, только учтите, что имеете дело с химиками, а не программистами. Кстати, а чего это Вы послали на химический форум агитировать математика, а не химика, которых у Вас есть и которые, правда, почему–то не знают о фирме MDL и возможностях IsisBase? Рога и копыта с надутыми щеками?

Ссылки на наши стати и патенты лежат у нас в открытом доступе на нашем сайте, а Вы, как всегда, поленились посмотреть.

 

1 час назад, химхлам сказал:

Да, мне не понравилась Ваша БД (язык не поднимается так её называть), поэтому и критикую,

не увидел в Ваших постах ни единого аргумента чем она Вам не понравилась, только истерика с Вашей стороны, с призывами, чтоб мы начали учиться устанавливать какое-то легаси 90-х годов.

 

Чтобы иметь право наставлять, Вам, уважаемый химхлам, нужно быть видным ученым с мировым именем, поэтому мне очень интересно узнать Ваш ORCID, чтоб оценить Ваш вклад в мировую науку и после этого принимать решение, стоит ли прислушиваться к Вашим советам, или все-таки отнестись к Вашим советам со здравым скептицизмом.

 

1 час назад, химхлам сказал:

Максимальный размер БД IsisBase ~100МБ, это примерно полмиллиона структур, для практикующего химика этого достаточно на всю жизнь и ещё много останется. Но если купить у фирмы IsisHost, работающий в паре с СУБД Oracle и спец. химическим картриджем, то можно создавать неограниченные БД.

 

Очень жалко, что Вы не идете в ногу с мировой наукой, размер базы данных PubChem - около 40 Терабайт, наверное Национальной Библиотеке Медицины такие базы зачем-то нужны?

 

Может все-таки, уважаемый химхлам и Вам настало время забыть legacy 90-х годов на 100 мегабайт и поддерживающее, как Вы сказали, максимум пол миллиона структур, у нас-то пол миллиарда структур уже сейчас и нашу базу покупать не надо - она бесплатная!

Изменено пользователем igorchem
Ссылка на комментарий

Да хоть сто миллиардов, зачем нужна таблица умножения на полмиллиарда ответов, если любой расчёт делает калькулятор, т.е. химические программы? Если бы Вы предлагали новую прогу, которая даёт какие–то плюшки, это ещё понятно, но готовые, уже услужливо посчитанные результаты, в т.ч. для нежилых структур, это дичь! 

Вы в состоянии дать ответ на этот вопрос? Спрашиваю не первый раз...

Ссылка на комментарий

Раз у вас база данных конформеров и на ее основе вы хотите основывать расчеты, то в вашей базе должны быть длины связей и углы между атомами. Только в этом случае вы сможете получить реальную пространственную модель молекулы. В этом случае ваша база очень важна будет для химиков.

Я не уверен, что рисунки PubChem отражают действительность, скорее всего это просто структурные формулы (может вы знаете лучше?).

Ссылка на комментарий
4 часа назад, chemister2010 сказал:

Раз у вас база данных конформеров и на ее основе вы хотите основывать расчеты, то в вашей базе должны быть длины связей и углы между атомами. Только в этом случае вы сможете получить реальную пространственную модель молекулы. В этом случае ваша база очень важна будет для химиков.

Спасибо большое за отзыв!

 

Да, действительно, у нас в базе для каждого конформера имеются координаты всех атомов и из них можно получить и длины связей и углы, включая торсионные. Пока эта возможность у нас есть только во внутреннем интерфейсе базы, но мы как раз собирались как-то выдавать эту информацию пользователю по его желанию.

 

Под каждой найденной молекулой есть возможность выбрать 2D и список (если есть) Conformer #1,.... Conformer #10.

 

2D - это обычный depict с PubChem - только для удобного отображения плоского рисунка, а вот в Conformer #1,.... Conformer #10 все конформеры с 3D координатами. Эти конформеры сейчас на экране можно вращать мышкой и смотреть на них с разных сторон.

 

Мы планировали выдавать для каждого конформера и углы, и длины связей, и координаты, но пока не придумали как было бы это удобно делать.

 

Если бы Вам было бы не сложно посоветовать, как это удобно было бы эту информацию видеть, с радостью прислушаемся и, надеюсь, скоро добавим!

 

Сам вижу, что, например, по двойному клику на атомы мы маркируем от двух до четырех атомов, и в зависимости от того, как они связаны, выдаем Ван-дер-Ваальсовы расстояния, обычные расстояния, углы или торсионные углы.

Изменено пользователем igorchem
Ссылка на комментарий

Для публикации сообщений создайте учётную запись или авторизуйтесь

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйте новый аккаунт в нашем сообществе. Это очень просто!

Регистрация нового пользователя

Войти

Уже есть аккаунт? Войти в систему.

Войти
  • Последние посетители   0 пользователей онлайн

    • Ни одного зарегистрированного пользователя не просматривает данную страницу
×
×
  • Создать...