Как создать единорога или

сервисы на основе искусственного интеллекта
Расскажу про свою давнюю любовь к разработке сервисов на основе искусственного интеллекта и об опыте создания прорывных ИТ проектов.
Первый проект с применением технологий искусственного интеллекта я сделал в 2007 году. Мы с командой создали нейросеть, которая распознавала прайс-листы поставщиков компьютеров, комплектующих, оргтехники. Так мы собрали базу из 400 поставщиков Москвы, в которую входило около 2 млн. товарных позиций, которая обновлялась ежедневно в автоматическом режиме примерно за 40 минут. Система автоматически распознавала новые строчки в прайсах поставщиков, привязывала их к единому справочнику, обновляла цены. От 2-10% позиций в прайсах поставщиков ежемесячно менялось, и поддерживать такой объем данных руками было просто нереально, а наша система с этим справлялась примерно за 2 часа – 40 минут обновления и 1.5 часа работы оператора по проверке правильно мэтчинга.
В общем решение было огонь, хотя проблем с нейросетью тоже хватало. Система хорошо распознавал товары с типовым набором компонентов, например процессоры, память, принтеры и очень туго понимала серверные компоненты или монтажное оборудование с высокой вариативность характеристик. На разработку движка ушло 6 месяцев и еще 9 на обучение нейросети.

Для 2007 это было революционное решение. Тогда нейросети не были горячей темой, как сейчас, тогда это была авангардная дичь.

Следующий интересный проект – соц. сеть знакомств по эротическим интересам. Описываешь свои фантазии, и система тебя мэтчит с теми, с кем они совпадают. Проект был сделан под продажу в будущем стратегу – крупному холдингу сайтов знакомств. В ней я использовал опыт прошлого проекта – система на основе описания составляла многоуровневую модель подбора партнера. Проще говорят мэтчинг работал на ура, если описание фантазии состояло из 5-7 предложений.
Но было две больших проблемы.
Первая – это жрицы любви. Они быстро «прочухали» тему и стали массово регистрироваться. А их присутствие сильно портило впечатление пользователей. Но к этому мы были готовы, и система автоматически блокировала все предложения интим услуг в прямом или косвенном виде.
Вторая – 80% пользователей были не в состоянии описать свои эротические фантазии, поэтому анкеты состояли из коротких описаний, типа «просто потрахаться», «анал», «секс с нормальной женщиной». Нейромозг не мог из этого сделать выводы и совпадения получались слишком широкие, условно все со всеми. Да, мы пробовали стимулировать пользователей, типа напиши нормальную анкету и получи 300 балов и т.д. Но секс табуированная тема и никакие баллы не помогли нам поменять поведение пользователей.
В итоге из 8 тыс анкет было всего 300 качественных мэтчингов при плановом показателе в 4 тыс. Фин. показатели не сошлись и проект закрыли. Конечно, мы придумали как вывести проект в плюс – подключиться к партнеркам, продавать рекламу, но это уже был не единорог, а «тихий пенсионный» проект.
Из интересного самыми дисциплинированными пользователями оказались представители секс меньшинств. Они аккуратно заполняли данные и по ним мэтчинг был самый хороший. Но их было меньше 10% от всех пользователей, а на таком количестве проект теряет инвест. привлекательность.

Следующий проект мой любимчик – юридическая экспертная система, которая оценивала вероятность возврата дебиторки через суд. Саму модель разработал клиент, нашей задачей было воплотить это в софте.
Идея такая. Когда клиент обращается к юристу, чтобы взыскать деньги с должника, то для начала юрист проводит анализ. А стоит ли вообще браться за дело. Например, а вдруг у юрлица, с которого планируется взыскание, генеральный директор - серийный «терпила», на котором 20 юрлиц висит и взыскивать там нечего. Но это явный фактор, это всем понятно. А в реальности далеко не все юристы могут дать квалифицированную оценку вероятности взыскания. Задача стояла научить машину думать, как юрист.
За 6 месяцев сделали основной код системы и 1.5 года ушло на обучение системы принятию решений. Но самым сложным оказалось не научить ИИ делать выводы как юрист, а убедить проф. сообщество, то этим выводам можно верить. То есть компьютер может управлять автомобилем, самолетом, делать сложные инженерные расчеты, моделировать движение космических объектов, писать музыку и рисовать картины, а проводить юридический анализ не может?
Самым крутым был кейс, когда известный крупный банк предоставил данные по 2 тыс. юридических лиц должников, взыскание с которых, по мнению юристов банка, не имело смысла. Сказали – все что взыщите, все ваше. Система нашла 97 юрдиц с которых можно было взыскать долги. И когда юристам банка отправили это на проверку, они подтвердили правильность выводов ИИ. Наш клиент благодаря этому получил крупный заказ от банка.
Еще из фишек проекта прототип системы планировали слияния и поглощений. Когда ИИ анализирует открытые данные и находит холдинги со слабой юридической защитой, пригодные для поглощения.

И на закуску горячий топчик. Электронный брокер – единорог в сфере недвижимости. В прошлом году обратился клиент с задачей сделать прорывной проект в сфере недвижимости. Поскольку он отказался от реализации, то «спалю фишку».
Если вы пробовали снимать или купить квартиру через сайты недвижимости, то столкнулись с тем, насколько это трудоемкий процесс.
Например, попробуйте найти квартиру, в которой ванная, а не душевая кабина, чтобы от работы до дома было не больше 45 минут, где владелец примет вас с животным и рядом есть школа. Чтобы это сделать, нужно ручками найти список квартир на сайте недвижимости по первичным признакам, глазками посмотреть в тексте карточки, нет ли ограничений для животных, посмотреть на фотке ванная там или душевая кабина, по карте посмотреть есть ли рядом школы, ручками на карте проверить реальное время до работы от адреса квартиры и так далее.
Брокер это делать за вас не будет. У него тоже семья и он тоже хочет кушать. Поэтому он будет внимательным только к тем клиентам кому «горит». Как следствие хороших брокеров передают друг другу как хороших врачей.
Проблема в том, что сайты поиска недвижимости по уровню развития как библиотечные каталоги 1992 года - карточки с параметрами. В век, когда компьютер умеет управлять самолетом и рисовать картины, вам надо руками перебирать карточки с описанием объектов недвижимости, чтобы узнать, как долго ехать до работы.
Электронный брокер бы спроектирован как потенциальный единорог в сфере брокериджа жилой и коммерческой недвижимости под продажу стратегу – крупному порталу, который купит это как опережающую стратегию.
Опишу тут небольшой перечень функций:
  1. Автоматический расчет логистики. То есть вы вводите адрес, дальше сервис сам считает время до работы, школы, пробки, время на машине и общественном транспорте в разное время суток. Магазин, рестораны и т.д. Все это есть в картографических сервисах, чтобы не заставлять владельцев и брокеров лапками это вводить.
  2. О том, что в квартире бабушкин ремонт система сможет сама определять после анализа фотографий, даже если в карточке написано, что ремонт свежий.
  3. Автоматическое дополнение данных об объекте. Например, вы узнаете о том, что из ЖК Mod рядом с Марьиной Рощей с утра не выехать из-за диких пробок в районе, даже если продавец не написал об этом. Система сама возьмет это из отзывов.
  4. Автоматические стратегии поиска, например, если вы инвестируете в недвижимость, то система сама отслеживает самые низкие цены, сравнивает их с остальным предложениями и предлагает вам уже отфильтрованные варианты.
Если интересно про все это подробнее, то заполните форму, пришлю вам файл с описанием проектов.

Made on
Tilda