Инвестиции

Использование нейронных сетей в финансах и маркетинге (часть 1)

Александр Горбунов , [31 июля 2001]

Итак, пытливые умы, нам предстоит с неким завидным постоянством устраивать тренинг для собственных мозгов. И, заметьте, по собственной воле, ведь мы стоим на пороге новой информационной эры и, как вы успели заметить из вузовской программы, некоторые аспекты нашей с вами жизни либо вообще не поддаются описанию или исследованию посредством классической статистики, либо требую до неприличия много времени. На данный момент есть вполне приемлемая альтернатива многочасовым исследованиям с помощью статистических пакетов — это нейросети.

Нейросеть представляется большинству среднестатистических граждан России чем-то из психиатрии, но, насколько я понимаю, мы с Вами четко представляем, о чем пойдет речь и, следовательно, не будем слишком вдаваться в математику, а сосредоточим свое внимание на практических аспектах использования нейропакетов.

Основное внимание мы обратим на самоорганизующиеся карты Кохонена. Предстоит почитать и пофилософствовать о работах профессора Тьюво Кохонен (Teuvo Kohonen, Финляндия), Гвидо Дебоека (ведущий эксперт Мирового Банка, США) и Сергея Шумского (наиболее продвинутый российский создатель и пользователь нейропакетов, Лебедевский физический институт, ФИАН). Что касается меня, то я буду стараться отфильтровать наиболее простую и доступную пониманию информацию для пользователей программных продуктов «а-ля ов-шелф».

Перечисленные выше по тексту уважаемые ученые мужи являются пионерами нейрокомпьютинга. Их исследовательские интересы сосредоточены на теории самоорганизации, ассоциативной памяти, нейросетях, и распознавании образов. На эти темы они написали несколько сотен статей, каждая из которых тянет по Российским меркам на кандидатскую, если не на докторскую, и несколько монографий (одна из них скоро выйдет на русском языке в Издательском Доме «Альпина»). Их труды примечательны тем, что пара сотен опубликованных статей вызвала в мире огромную волну откликов. Например, тысячи пытливых умов начали исследовать проблему самоорганизации, и в последнее время было опубликовано 3300 работ по Самоорганизующимся картам Кохонена, которые осветили вопросы практического применения этой техники применительно к анализу финансовых данных, в целях маркетинга товаров.

Кохонен начал свои исследования в начале 81 года. Задача была крайне проста — создать эффективный алгоритм, который позволил бы распределить компактно и равномерно по поверхности некой карты схожие многомерные данные, представленные похожими друг на друга векторами из входного пространства. Множество экспериментов было поставлено с использованием самоорганизующихся карта, включая формирование карт фонем в целях распознавания речи.

Насколько я понимаю, настало время рассказать о самоорганизации на уровне интуитивного понимания.

Представим себе группы людей (одни из них круглоголовые, другие треугольноголовые, а третьи имеют квадратные головы — форма головы позволяет отойти от дискриминации по половому, расовому или возрастному признаку), сгруппированную в центре некоего жизненного пространства, скажем, спортзала. Каждый представитель из этой толпы является в некоторой степени «другом» того или иного индивидуума в этом спортзале. Крепость дружбы двух персон определяется или пропорциональна схожести формы голов этих бравых парней.

Мы желаем осчастливить этих людей, предоставив им большее пространство, и при этом сохранить их социальные связи и привязанности. Таким образом мы стоим перед двойственной задачей:
  • Распределить людей равномерно по спортзалу (спортзал может быть как прямоугольным, так и многогранником);
  • Разместить друзей поближе друг к другу. Более точно, расстояние от одного человека до другого должно быть пропорционально степени схожести между ними.
Настало время подвергнуть всех этих людей некоему процессу самоорганизации посмотреть, что из этого получится.

ШАГ 1. Определение параметра процесса. Зададим некий круг отбора схожести, т.е. дружественности людей по отношению друг к другу. Этот параметр довольно громоздкий, но он будет постепенно уменьшаться с каждой итерацией. Он контролирует количество друзей, которое располагается вблизи каждой персоны в каждый момент времени (при каждой итерации). По мере сужения «круга дружественности», недруги первыми покидают его.
ШАГ 2. Генерация точки позиционирования. Генерируем случайным образом координатную точку в нашем замкнутом пространстве. Точки генерируются в рамках нормального распределения в пределах жизненного пространства.
ШАГ 3. Организация соревнования за «место под солнцем». Позволим людям с разными формами голов соревноваться за эти «места под солнцем», т.е. предложим индивидуумам поиграть в «царя горы» или побегать на перегонки — кто первым добежит до точки.
ШАГ 4. Миграция победителя и его соседей. Перемещаем победителя в гонке на выживание в точку, сгенерированную случайным образом. Переместим так же друзей победителя из ранее очерченного круга дружбы поближе к точке. Размещаем друзей более близко к этой точке по сравнению с почти друзьями и недругами.
ШАГ 5. Коррекция параметров процесса. Уменьшаем диаметр «круга дружбы». В случае, если «круг дружбы» достаточно велик, чтобы уместились в нем несколько друзей — возвращаемся к шагу 2.

Существуют три важных элемента при процессе самоорганизации Кохонена, которые мы задействовали при процессе консолидации друзей в ходе пошагового выполнения выше определенных нами шагов:
  • Нормальное распределение. Все это безобразие творится в силу того, что люди вынуждены соревноваться друг с другом за «место под солнцем», побеждать в гонке на выживание и мигрировать к тем самым точкам, которые равномерно распределяются. Когда наш подопечный «выигрывает гонку к точке» и перемещается на нее, он или она находится в лучших условиях для победы в гонке за вторую точку (точки), которые в свою очередь могут оказаться вблизи уже «обжитой» ранее точкой. По мере того, как каждый индивидуум соревнуется за точки, которые генерируются в рамках нормального распределения без приоритетов по отношению к какому-либо победителю, со временем, каждый «спортсмен» получит свое индивидуальное «место под солнцем» и популяция практически равномерно распределится по замкнутому пространству.
  • Кластеризация. По мере того, как «победитель» перемещается в точку, которую он выиграл в гонке, происходи волна миграции его ближайших друзей к этой самой точке. Это объясняет, почему происходит кластеризация. В целях усиления процесса кластеризации: в ходе последовательных итераций, когда точки генерируются вблизи точки, которую уже кто-то выиграл, друзья победителя находятся в преимущественной позиции по отношению к недругам, и, соответственно, ближайшие друзья имеют отличные шансы выиграть вновь появившуюся точку и потянуть за собой своих друзей (включая и предыдущего победителя).

    Дистанция, на которую мигрируют победители и их друзья контролируется целевым параметром расстояния, которое следует пробежать. Этот параметр пропорционален степени родства, схожести, дружественности индивидуумов (которые мигрируют в данный момент) по отношению к победителю. Очевидно, что целевой параметр расстояния пробежки к точке является наибольшим для победителя, т.е. для персоны, которая имеет наибольшую степень похожести «сама на себя». Это уже объясняет, почему друзья не только кластеризуются, но и наблюдается упорядоченность в процессе кластеризации: дистанция одной персоны от другой пропорциональна степени схожести между ними. Скажем люди с треугольными головами, как правило, располагаются ближе к квадратноголовым, нежели к круглоголовым людям. В силу того, что треугольник и квадрат более схожи меж собой, чем круг и треугольник.
  • «Карабканье в гору». Перемещение победителей в точку назовем «основной волной миграции», в то время, как перемещения друзей определим, как «вторая волна миграции». Основная волна миграции — это естественное желание победителя улучшить свои жилищные условия, в то время, как друзья победителя с рабской покорностью следуют за победителем; вторичная волна миграции может улучшать, а может и нет положение друзей победителя. Именно этот процесс двух волн миграции и можно определить как механизм «карабканья в гору» в ходе процесса самоорганизации.

В этом обзоре я попытался в доступной форме объяснить в чем заключается суть метода и показать, что нейронные сети это не черный ящик. В других обзорах я сконцентрировался на примерах практического применения указанных выше методов в финансах и маркетинге. Примеры будут самые разные от прогнозирования рынка акций и создания рейтинга банков до прогнозирования продаж и сегментирования потребителей.
Главная страница
Инвестиции в России
Теория инвестиций
Бизнес-планы
Маркетинг
Бизнес-астрология
Доска объявлений
О сайте
 









Разработка © «Бизнес-эксперт К», 2001—2008
Хостинг
Перепечатка без разрешения правообладателей текстов запрещена.

Написать в редакцию