Продолжу тему перспектив. РКЦ крутейшая, но далеко не единственная перспектива с хорошими возможностями на стадии учебы в вузе. Например, есть такой проект, как ТинькоффАкадемия или в связке конкретно с МФТИ –
ТинькоффЛаб. Это что-то вроде коллаба вуза (МФТИ, ВШЭ, МГУ и т.д.) и Тинькофф, у которого в данном случае свои интересы. Основное направление, естественно, айтишное – преимущественно машинное обучение. Участие в проекте для студента заключается в следующем: примерно 20 часов в неделю они участвуют в реальных проектах (список проектов можно по ссылке выше посмотреть) прикладных или научных, получая знания, навыки, опыт и зарплату с официальным оформлением в своем вузе. По результатам можно получить довольно вкусный по условиям, в т.ч. и финансовым, оффер от Тинькофф. Одна просто одна из многих возможностей у многих айтишных подразделений крупных компаний Сбер, Тинькофф и т.д. есть свои базовые кафедры в институтах с интересными условиями и перспективами. Подчеркну, что базовая кафедра в данном случае это что-то вроде «специализации», т.е. та структура, на основе которой будет выполняться выпускная (дипломная) работа.
Теперь чуть простыня про айти и машинное обучение (МО, в широчайшем смысле), в частности. Современная наука, работающая с огромными объемами данных, завязана на МО. Несколько примеров.
Большой адронный коллайдер (фундаментальные взаимодействия, физика высоких энергий, элементарных частиц и т.д.). В этом году состоялся «Третий запуск» - Run 3. Каждый из запусков длится некоторое время, при этом производится множество столкновений частиц, в результате которых получается просто невероятное количество исходных данных в «сыром формате» - от датчиков. Потом остановка, перенастройка длиной в несколько лет под новые эксперименты, и следующий запуск. Фишка в том, что данные полученные в результате Run 1 (2010-2012 годы) будут ковырять и совершать или не совершать на их основе открытия еще несколько лет, а то и десятилетий. Буквально в прошлом (2022) году в одном из методов обработки данных нашли маленький косячок и полученные на его основе надежды на открытие «Новой Физики» (не укладывающейся в Стандартную Модель) по одному из направлений пошли лесом. Главную работу по обработке «сырых данных», поиску закономерностей, аномалий делает МО, т.к. вручную перебрать такую прорву данных даже усилием тысяч человек нереально за разумное время. При чем, доступ к данным имеют ученые со всего мира. Потенциально любой коллектив, работающий с результатами запуском БАКа, имеет шанс совершить открытие.
Нейтринный телескоп IceCube (астрофизика, физика элементарных частиц и т.д.), который в глубинах (до 2,5 км) антарктического льда «отслеживает» мюоны, порождаемые потоками нейтрино, которые пришли из недр Вселенной. Фундаментальнейшая вещь. И при этом, снова – огромные объемы данных, которые доступны ученым по всему миру. И опять – МО, и потенциальная возможность совершения открытий для любой научной группы, работающей с этими данными.
Биологические базы данных (биофизика, биология, биоинформатика и т.д.). Для меня эта относительно свежая тема, но тем не менее она меня весьма зацепила. Суть (в существенно упрощенных формулировках). Сейчас методы секвенирования (определение аминокислотной или нуклеотидной последовательности) развились настолько, что их на чем только не применяют: взяли природный образец, например, воду из сточной канавы, скормили соответствующей установке, получили последовательности. «Чьи» они, что с ними делать? Пофиг, потом разберемся, а пока сохраним на будущее – в специализированную базу. И получается, что соответствующие данные накапливаются несопоставимо быстрее, чем их анализируют. Не в таких масштабах, как с БАК, но перекос существенный. И тут снова на арену выходит МО. Как это, работает на практике? Случай оторванный от реальности (конкретные примеры я забыл, а потом высасываю из пальца). Некто, исследуя содержимое прямой кишки какого-нибудь редкого пингвина, обнаружил в ней бактерию, в бактерии – фермент, который, ну пусть, позволяет очень быстро расщепить пластик. Вроде бы «Ура!», но для того, добывать из прямой кишки редкого пингвина этот фермент ультрадорого. Поэтому секвенируем фермент, и делаем поиск по базам – вдруг еще где-нибудь похожие белковые соединения встречаются. Их таких в зависимости от «критерия похожести» может быть дофигища, и всех их проверять на чудодейственные свойства опять ультрадорого. Снова работа для МО: кластеризация, выделение типичных представителей каждой из сформированных групп и т.д. Если на выходе получается разумное количество различных белков, то уже тогда переходят к «натурным» испытаниям. Подобная работа с биоданными называется «сухой» биологией, работа с «натурашкой» - «мокрой». И в последние годы «сухая» биология, биофизика и т.д. набирает обороты с соответствующим спросом на специалистов.
В общем, к чему вся эта простыня? К тому, что МО (подчеркну снова – в широком смысле) сейчас это в очень многих бочках затычка. Спрос на соответствующие навыки в различных научных исследованиях и прикладных разработка очень высок, а потому хорошее образование в этой области может быть пропуском в разные направления. Т.е. необязательно сразу поступать на какую-то конкретную узкую специализацию, имея за плечами хорошее умение в МО, их в будущем можно менять. Я не просто так привел 3 этих примера, это тот путь (БАКовская фундаменталка, астрофизика, биофиз) человека, который сейчас возглавляет одну из физтеховских биофиз-лабораторий. При чем, по каждому из направлений он продуктивно работал, в т.ч., и в зарубежных институтах, где в принципе считается хорошим опытом для ученого попробовать себя в разных областях.
Еще один весомый плюс «умения в МО»: если наступит разочарование в науке, всегда можно уйти в «айти»… В МФТИ сейчас стараются даже на чисто научных направлениях давать сильную айтишку, чтобы у студентов был запасной вариант в случае разочарования в науке. Многие, кстати, этим пользуются, т.к. зачастую айти получается гораздо выгоднее – не вся наука, как в РКЦ.
ИМХО.