Интеллектуальные информационные системы

Пример решения задания "Оценить


В подсистеме "Оптимизация" режиме "Исключение признаков с низкой селективной силой" получаем перечень признаков, ранжированных в порядке убывания среднего количества информации о направлении следования состава (таблица 50).

Таблица 50 – ПРИЗНАКИ В ПОРЯДКЕ УБЫВАНИЯ СЕЛЕКТИВНОЙ СИЛЫ

08-11-04            18:49:35                         г.Краснодар

================================================================

| N° | Код |    Н а и м е н о в а н и е    |Ценн.|Сумма| Сумма |

|п/п |п.пр.|       п р и з н а к о в       | Бит | Бит |   %   |

================================================================

|   1|  14 |груз_2_коротких_прямоугольника.|0.476|0.476|  4.888|

|   2|  17 |груз_3_маленьких_круга.........|0.476|0.953|  9.776|



|   3|   3 |Кол-во_вагонов=2...............|0.431|1.384| 14.201|

|   4|  18 |груза_нет......................|0.414|1.798| 18.448|

|   5|  10 |груз_1_перевернутый_треугольник|0.405|2.202| 22.599|

|   6|  15 |груз_2_маленьких_круга.........|0.405|2.607| 26.750|

|   7|  30 |форма_вагона_ромбовидная.......|0.405|3.011| 30.901|

|   8|  27 |форма_вагона_U-образная........|0.388|3.399| 34.885|

|   9|   7 |груз_1_длинный_прямоугольник...|0.372|3.772| 38.705|

|  10|   9 |груз_1_короткий_прямоугольник..|0.372|4.144| 42.526|

|  11|   8 |груз_1_квадрат.................|0.358|4.502| 46.203|

|  12|  11 |груз_1_ромб....................|0.358|4.861| 49.881|

|  13|  13 |груз_1_шестиугольник...........|0.358|5.219| 53.559|

|  14|  16 |груз_3_квадрата................|0.358|5.577| 57.236|

|  15|  22 |крыша_вагона_двухскатная.......|0.358|5.936| 60.914|

|  16|  31 |форма_вагона_эллипсоидная......|0.358|6.294| 64.591|

|  17|  21 |крыша_вагона_гофрированная.....|0.358|6.652| 68.266|

|  18|   2 |N_осей_вагона=3................|0.323|6.975| 71.577|

|  19|  25 |стенки_вагона_двойные..........|0.315|7.290| 74.807|

|  20|   4 |Кол-во_вагонов=3...............|0.304|7.594| 77.927|

|  21|  28 |форма_вагона_V-образная........|0.280|7.873| 80.797|

|  22|  24 |крыша_вагона_прямая............|0.266|8.139| 83.523|

|  23|   5 |Кол-во_вагонов=4...............|0.263|8.402| 86.224|

|  24|  29 |форма_вагона_прямоугольная.....|0.206|8.608| 88.340|

|  25|  23 |крыша_вагона_отсутствует.......|0.201|8.809| 90.403|

|  26|  12 |груз_1_треугольник.............|0.191|9.000| 92.358|

|  27|   6 |груз_1_большой_круг............|0.190|9.190| 94.307|

|  28|  19 |длина_вагона_длинный...........|0.160|9.350| 95.954|

|  29|  20 |длина_вагона_короткий..........|0.158|9.508| 97.573|

|  30|   1 |N_осей_вагона=2................|0.141|9.649| 99.015|

|  31|  26 |стенки_вагона_одинарные........|0.096|9.745|100.000|

================================================================

Универсальная когнитивная аналитическая система      НПП *ЭЙДОС*

Накопительная диаграмма селективной силы (Парето-диаграмма) приведена на рисунке 94.

Рисунок 94. Парето-диаграмма ценности признаков для решения задач

идентификации, прогнозирования и управления


В подсистеме: "F3 Оптимизация" выбрать режим: "Исключение признаков с низкой селективной силой". В результате появится экранная форма, представленная на рисунке 102:

Рисунок 102. Экранная форма "Селективная сила признаков"

Количественные значения селективной силы можно просмотреть, прокручивания экранную форму по горизонтали.

Более подробно эта информация представлена в таблице 55:

Таблица 55 – ПРИЗНАКИ (ГРАДАЦИИ ШКАЛ)

В ПОРЯДКЕ УБЫВАНИЯ СЕЛЕКТИВНОЙ СИЛЫ (ИНТ.ИНФ.)

10-10-04            16:15:55                                                  г.Краснодар

=========================================================================================

|N°|Код |Код | Наименование            | Наименование          |Интегр.|Сумм.инт|Сумм.ин|

|  |К.шк|град| классификационной шкалы | градации              |инф-ть |инф. Бит|  в %  |

=========================================================================================

| 1|  5 | 19 |ОДЕЖДА:.................. Юбка...................|  0.470|   0.470|  4.147|

| 2|  3 | 10 |ЦВЕТ ГЛАЗ:............... Голубые................|  0.467|   0.938|  8.271|

| 3|  8 | 30 |ПОСЕЩАЕМОСТЬ:............ Плохая.................|  0.456|   1.393| 12.290|

| 4|  8 | 33 |ПОСЕЩАЕМОСТЬ:............ Очень хорошая..........|  0.438|   1.831| 16.150|

| 5|  2 |  8 |ЦВЕТ ВОЛОС:.............. Очень светлые..........|  0.437|   2.268| 20.002|

| 6|  1 |  3 |ДЛИНА ВОЛОС:............. Длинные................|  0.429|   2.697| 23.788|

| 7|  2 |  7 |ЦВЕТ ВОЛОС:.............. Крашеные...............|  0.421|   3.118| 27.502|

| 8|  1 |  2 |ДЛИНА ВОЛОС:............. Средние................|  0.418|   3.536| 31.192|

| 9|  7 | 28 |ДОСТАТОК:................ Ничего нет.............|  0.413|   3.949| 34.836|

|10|  5 | 17 |ОДЕЖДА:.................. Пиджак.................|  0.408|   4.357| 38.432|

|11|  7 | 25 |ДОСТАТОК:................ Есть автомобиль........|  0.408|   4.765| 42.027|

|12|  4 | 16 |НАЛИЧИЕ УКРАШЕНИЙ:.......


Для решения этой задачи запустим 2-й режим в 3-й подсистеме (рисунок137). В этом режиме все признаки, которыми в данном примере являются буквы, выводятся системой "Эйдос" в порядке убывания среднего количества информации, которое в них содержится о принадлежности к словам. Если просуммировать ценность букв "нарастающим итогом" то получим накопительную кривую, представленную на рисунке 138. Эта кривая называется "Парето-диаграмма" по имени известного итальянского математика и экономиста XIX, Вильфредо Парето, впервые предложившего оценивать силу влияния факторов, исключать из рассмотрения незначимые факторы и впервые построившего подобные диаграммы.

Рисунок 137. Запуск режима системы "Эйдос" измерения ценности признаков для решения задач идентификации, прогнозирования и управления

Рисунок 138. Парето-диаграмма ценности букв для идентификации слов

Характерная "полочка" на Парето-диаграмме соответствует цифрам и буквам латинского алфавита, которые не встретились

в словах обучающей выборки. В таблице 74 приведены буквы, проранжированные в порядке убывания среднего количества информации в них, о принадлежности к словам.

Таблица 74 – ЦЕННОСТЬ БУКВ ДЛЯ ИДЕНТИФИКАЦИИ СЛОВ

Код

Буква

Ценность (бит)

Ценность (бит)

"нарастающим итогом"

Ценность (%)

"нарастающим итогом"

1

66

Э

0,76988

0,76988

4,841

2

56

У

0,74529

1,51517

9,526

3

49

М

0,71090

2,22607

13,996

4

46

Й

0,69728

2,92335

18,380

5

61

Ш

0,68748

3,61083

22,703

6

47

К

0,68569

4,29652

27,014

7

67

Ю

0,66376

4,96028

31,187

8

52

П

0,66014

5,62042

35,338

9

64

Ы

0,65157

6,27199

39,434

10

41

Д

0,64023

6,91222

43,460

11

68

Я

0,63612

7,54834

47,459

12

44

З

0,62131

8,16965

51,366

13

65

Ь

0,59697

8,76662

55,119

14

38

Б

0,59622

9,36284

58,868

15

53

Р

0,58610

9,94894

62,553

16

59

Ц

0,57201

10,52095

66,149

17

40

Г

0,56958

11,09053

69,730

18

39

В

0,55490

11,64543

73,219

19

62

Щ

0,52045

12,16588

76,492

20

37

А

0,51477

12,68065

79,728

21

48

Л

0,50010

13,18075

82,872

22

54

С

0,47977

13,66052

85,889

23

55

Т

0,47498

14,13550

88,875

24

51

О

0,46548

14,60098

91,802

25

50

Н

0,45089

15,05187

94,637

26

45

И

0,43046

15,48233

97,343

27

42

Е

0,42253

15,90486

100,000



Содержание раздела