Предприятията днес разполагат с огромни обеми от неструктурирани данни – от записи на телефонни разговори и видео материали до истории на клиентски оплаквания и сигнали от веригата на доставки. Според оценките до 90% от генерираните данни в организациите спадат към тази категория. Въпреки това, заради тяхната хаотична и непредвидима природа, тези данни исторически са оставали неизползвани, поради огромните трудности при тяхната обработка и анализ.
Въпреки предизвикателствата, ефективното управление и централизация на тези „неподредени“ данни могат да превърнат това богатство в безценно бизнес предимство. Тези данни са източник на обучение и усъвършенстване на следващите поколения системи за изкуствен интелект (ИИ), подобрявайки тяхната точност, контекстуална осведоменост и гъвкавост. Освен това, правилното им използване може да разкрие дълбоки аналитични прозрения, които реализират реални бизнес ползи.
Ярък пример за успешното прилагане на такива данни идва от баскетболния отбор в NBA – Charlotte Hornets. Екипът успя да извлече ценна информация от видео записи на игри, които до момента бяха твърде обемни за обстойно преглеждане и твърде неструктурирани за ефективен анализ. Така те идентифицираха състезател, който стана ключова фигура и донесе на отбора нови успехи. Преди обаче резултатите да станат видими, анализаторите на отбора трябваха първо да преодолеят същественото предизвикателство да подготвят суровите видео материали за точна интерпретация.
Неструктурираните данни са сложни за обработка поради множество причини – те могат да бъдат в различни формати, с различно качество и достоверност. За да се извлече смисъл от тях, се изискват специализирани инструменти, като обработка на естествен език (NLP) и изкуствен интелект.
Освен това в неструктурираните данни на всяка организация има специфични за бранша характеристики и терминология, които общите ИИ модели не разпознават интуитивно. Например, финансова институция не може просто да приложи универсален езиков модел за откриването на измами, а трябва да прецизира модела, така че той да разбира специфични регулаторни термини, модели на транзакции, индикатори за риск в сектора и уникални корпоративни контексти, като политики за данъчна сигурност.
Проблемът е още по-сложен при интегрирането на няколко източника с различна структура и стандарти за качество, което изисква умения да се отделят ценните данни от шума и неадекватните записи.
При търсенето на нов състезател, Charlotte Hornets заложиха на инструменти с изкуствен интелект, сред които и компютърно зрение, за да анализират сурови видео записи от по-ниски лиги. Тези лиги са извън обичайния обхват на скаутите в NBA и затова досега бяха пренебрегвани за системен анализ.
„Компютърното зрение е инструмент, съществуващ от известно време, но с епохата на ИИ приложимостта му нараства изключително бързо,“ обяснява Джордан Сили, старши вицепрезидент в компанията Invisible Technologies, която съдейства на Hornets. „Сега можем да използваме източници на данни, които досега не сме могли да обработваме, и да им придадем аналитично измерение, което никога досега не е съществувало.“
Екипът използва разнообразни техники на компютърното зрение, като проследяване на обекти и играчи, анализ на моделите на движение и геометрично картографиране на точки на игрището. Така беше изведена кинематична информация за координатите на играчите, която позволи изчисления на показатели като скорост и експлозивност в ускорението.
Тези данни дадоха на треньорите детайлна, базирана на числа, представа за всеки играч, което помогна за избора на най-подходящия състезател, запълващ конкретна празнина в отбора. Избраният състезател стана най-ценният играч на лятната лига на NBA през 2025 г. и помогна на отбора да спечели първата си лятна шампионска титла.
Преди данните от видеозаписите да бъдат използвани, те трябва да бъдат етикетирани (анотирани), за да може моделът да ги интерпретира. Например координатите на играчите в полето са маркирани с ограничителни рамки, за да се проследява движението на всеки участник във времето. Само след правилното анотиране, системите могат да откриват и отделят индивидуалните действия на играчите.
Опитът на Charlotte Hornets дава ценни уроци. Първо, неструктурираните данни трябва да се подготвят чрез интуитивни методи за събиране, а също така е необходима изградена инфраструктура от подходящи канали и регистри за управление на данните.
„Неструктурираните данни могат да бъдат използвани само когато структурираният ви масив е изчистен и готов за AI,“ посочва Сили. „Не можете просто да хвърлите изкуствен интелект върху проблем без предварителна подготовка.“
Това налага много организации да си партнират с доставчици на техническа подкрепа, които да настройват и адаптират моделите към конкретния бизнес контекст. Традиционната методология на консултиране, при която външен доставчик ръководи дългогодишна трансформация, не е адекватна за динамиката на ИИ, където решенията трябва да се адаптират към новите бизнес реалности бързо и ефективно.
Една популярна и все по-широко разпространена моделна практика е използването на „инженери на място“ (Forward-Deployed Engineers, FDEs), въведени първоначално от Palantir. Тези специалисти работят директно във фирмата-клиент, събират контекста и настройват технологиите съобразно операциите, преди да стартира решението.
„Не можем да постигнем успех без нашите FDEs,“ казва Сили. „Те настройват моделите, работят с екипа за анотация, за да създадат бази от валидирани данни, които помагат да се подобри точността в режим на производство.“
Второ, данните трябва да се разбират в собствен контекст, като моделите се калибрират спрямо конкретни задачи.
„Не може да се очаква, че един универсален модел за компютърно зрение ще реши, например, проблем с управление на инвентара, просто като се приложи на случаен принцип към неструктурираните ви данни,“ отбелязва Сили. „Тези модели трябва да бъдат фино настроени, за да изнасят данни в желания формат и да подпомагат вашите цели. Тогава започват да се получават високо ефективни модели с реална бизнес стойност.“
Конкретно за Charlotte Hornets, Invisible Technologies е използвала пет основни модела, адаптирани специално към баскетболните данни. Моделите бяха обучени да разпознават баскетболно игрище, отличавайки го от други спортове като футбол. Те научиха правилата на играта – броя играчи, зоните на терена, моментите „извън границите“ и т.н. След тази настройка, моделите възприеха сложни визуални сценарии с висока точност за откриване на обекти, проследяване, пози и пространствено картографиране.
Независимо от бързите промени в технологиите, компаниите не бива да пренебрегват класическите бизнес показатели и ясната цел. Без дефинирана бизнес цел, пилотните AI проекти могат лесно да прераснат в безкрайни изследвания, които източват ресурси като изчислителна мощ, данни и персонал.
„Най-успешните проекти са тези, в които има яснота какво се иска,“ заключва Сили. „Най-проблемните са, когато хората просто искат „ИИ“, но нямат конкретна посока. Така се оказват на безкрайно пътешествие без карта.“
Този анализ показва, че комбинирането на подходящи технологии за обработка на неструктурирани данни, внимателно адаптиране на AI модели и ясно зададени бизнес цели може да отключи огромния потенциал на източниците, които преди са били загърбвани. Примерът с Charlotte Hornets е само началото на това как спортни, финансови и други компании могат да използват „хаотичните“ данни като мощно конкурентно оръжие.
Причини за спад на Биткойн до 25 000 долара и прогнози за пазарния цикъл
MIT студент проектира автомобил с химична батерия в иновативната BioMaker лаборатория
Биткойн над 93 000 долара, алткойни растат, големите инвеститори движат пазара