chemister2010 Опубликовано 26 Декабря, 2024 в 17:10 Поделиться Опубликовано 26 Декабря, 2024 в 17:10 (изменено) В 26.12.2024 в 20:02, ZZZ7ZZZ сказал: А что потом с этими 34350-ти символами делать? Сохранить - понятно. Убрать лишние символы (нумерацию аминокислот, пробелы). Потом заменить однобуквенный код на названия остатков аминокислот. https://kodomo.fbb.msu.ru/~youthofchemist/projects/Term_1/AminoAcid/index.html Например, A - это аланил, R - аргинил, E - глутамил, Q - глутаминил и т.д. После 20 замен получится русское название аминокислотной последовательности титина. Только в последней аминокислоте надо будет окончание не -ил, а -ин сделать. Если заморочится серьезнее, то можно еще вставить все фосфорилированные остатки аминокислот (там есть таблица ниже последовательности). Можно упростить работу если задача просто посчитать число букв - можно просто пересчитать сколько было фосфорилировано аминокислот и число букв в слове фосфо (5) умножить на число фосфорилированных остатков и добавить к полученному результату для аминокислот. Изменено 26 Декабря, 2024 в 17:21 пользователем chemister2010 Ссылка на комментарий
yatcheh Опубликовано 26 Декабря, 2024 в 17:16 Поделиться Опубликовано 26 Декабря, 2024 в 17:16 В 26.12.2024 в 20:10, chemister2010 сказал: Убрать лишние символы (нумерацию аминокислот, пробелы). Потом заменить однобуквенный код на названия остатков аминокислот. https://kodomo.fbb.msu.ru/~youthofchemist/projects/Term_1/AminoAcid/index.html Например, A - это аланил, R - аргинил, E - глутамил, Q - глутаминил и т.д. После 20 замен получится русское название аминокислотной последовательности титина. Только в последней аминокислоте надо будет окончание не -ил, а -ин сделать. Если заморочится серьезнее, то можно еще вставить все фосфорилированные остатки аминокислот (там есть таблица ниже последовательности). Ну всё, дело в шляпе! Ссылка на комментарий
chemister2010 Опубликовано 26 Декабря, 2024 в 17:17 Поделиться Опубликовано 26 Декабря, 2024 в 17:17 В принципе можно сделать расчет брутто-формулы, хотя это сложнее. Если компьютер очень мощный, можно даже сгенерировать химическое название 1 хромосомы человека. Но там 248 миллионов пар нуклеотидов и размер файла будет в гигабайтах. Это будет самое длинное русское слово сгенерированное человеком. Ссылка на комментарий
ZZZ7ZZZ Опубликовано 26 Декабря, 2024 в 17:20 Поделиться Опубликовано 26 Декабря, 2024 в 17:20 В 26.12.2024 в 23:10, chemister2010 сказал: Например, A - это аланил, R - аргинил В таблице все на -ин Плюс две кислоты из двух слов. Ссылка на комментарий
yatcheh Опубликовано 26 Декабря, 2024 в 17:22 Поделиться Опубликовано 26 Декабря, 2024 в 17:22 В 26.12.2024 в 20:17, chemister2010 сказал: В принципе можно сделать расчет брутто-формулы, хотя это сложнее. Если компьютер очень мощный, можно даже сгенерировать химическое название 1 хромосомы человека. Но там 248 миллионов пар нуклеотидов и размер файла будет в гигабайтах. Это будет самое длинное русское слово сгенерированное человеком. Фигня, и это можно сделать. Ничего тут особо мощного тут не надо. Ссылка на комментарий
chemister2010 Опубликовано 26 Декабря, 2024 в 17:24 Поделиться Опубликовано 26 Декабря, 2024 в 17:24 В 26.12.2024 в 20:20, ZZZ7ZZZ сказал: В таблице все на -ин Плюс две кислоты из двух слов. Там нужно -ин заменить на -ил, кроме 2 исключений: глутимин меняется на глутаминил, аспарагин меняется на аспарагинил. Это из-за того, что у глутаминовой кислоты как раз глутамил, а у аспарагиновой кислоты аспарагил. В 26.12.2024 в 20:22, yatcheh сказал: Фигня, и это можно сделать. Ничего тут особо мощного тут не надо. Не все компы и программы могут работать с текстовыми файлами в 5-10 Гб. Даже файловые системы глючат при таких объемах. Ссылка на комментарий
ZZZ7ZZZ Опубликовано 26 Декабря, 2024 в 17:33 Поделиться Опубликовано 26 Декабря, 2024 в 17:33 В 26.12.2024 в 23:24, chemister2010 сказал: Там нужно -ин заменить на -ил поправь, чтоб точно не пролететь. A Аланин R Аргинин N Аспарагин D Аспарагиновая кислота V Валин H Гистидин G Глицин Q Глутамин E Глутаминовая кислота I Изолейцин L Лейцин K Лизин M Метионин P Пролин S Серин Y Тирозин T Треонин W Триптофан F Фенилаланин V Цистеин Ссылка на комментарий
chemister2010 Опубликовано 26 Декабря, 2024 в 17:45 Поделиться Опубликовано 26 Декабря, 2024 в 17:45 A Аланил R Аргинил N Аспарагинил D Аспартил V Валил H Гистидил G Глицил Q Глутаминил E Глутамил I Изолейцил L Лейцил K Лизил M Метионил P Пролил S Серил Y Тирозил T Треонил W Триптофил F Фенилаланил V Цистеинил В 26.12.2024 в 20:33, ZZZ7ZZZ сказал: поправь, чтоб точно не пролететь. Сделал табличку Ссылка на комментарий
yatcheh Опубликовано 26 Декабря, 2024 в 17:52 Поделиться Опубликовано 26 Декабря, 2024 в 17:52 В 26.12.2024 в 20:24, chemister2010 сказал: Там нужно -ин заменить на -ил, кроме 2 исключений: глутимин меняется на глутаминил, аспарагин меняется на аспарагинил. Это из-за того, что у глутаминовой кислоты как раз глутамил, а у аспарагиновой кислоты аспарагил. Не все компы и программы могут работать с текстовыми файлами в 5-10 Гб. Даже файловые системы глючат при таких объемах. Так аспарагил, или аспартил? 10Гб - фигня. Я шифратор делал, так он 40-гигабайтные файлы двухпроходным алгоритмом только так щёлкал. Ссылка на комментарий
chemister2010 Опубликовано 26 Декабря, 2024 в 18:01 Поделиться Опубликовано 26 Декабря, 2024 в 18:01 В 26.12.2024 в 20:52, yatcheh сказал: Так аспарагил, или аспартил? 10Гб - фигня. Я шифратор делал, так он 40-гигабайтные файлы двухпроходным алгоритмом только так щёлкал. Согласно белой книге ИЮПАК все-таки аспартил. 1 Ссылка на комментарий
Рекомендуемые сообщения
Для публикации сообщений создайте учётную запись или авторизуйтесь
Вы должны быть пользователем, чтобы оставить комментарий
Создать аккаунт
Зарегистрируйте новый аккаунт в нашем сообществе. Это очень просто!
Регистрация нового пользователяВойти
Уже есть аккаунт? Войти в систему.
Войти