Даная методика иллюстрируется примером извлечения знаний из эксперта James Ruiz при создании диагностической системы рака груди для Baton Rouge, (Louisiana), Women hospital.


Чтобы посмотреть этот PDF файл с форматированием и разметкой, скачайте файл и откройте на своем компьютере.
ИНɎОРМȺЦИОННЫЕ ТЕɏНОЛОȽИИ Виɬяев Ковалерчɭк Меɬоɞика извлечения эксперɬа Раɛоɬа ɝранɬом РɎɎИ 08-07-00272- 1, 115, ɬакже Ƚосконɬракɬом 2007-4-1.4-00-04 Презиɞенɬа ɝосɭɞарсɬвенной поɞɞержке веɞɭщиɯ наɭчныɯ начиная признаками 11 меɞицинскиɯ оɛнарɭжил первичные 11 ɛинарныɯ признаков 4, моɝɭɬ преɞсɬавлены ɞоɛавлением ɞвɭɯ новыɯ – w – ∨ – š – š – š 5, рассмаɬриваем пяɬь 4, ɭровне 1. признак значениями (0 ɞоɛрокачесɬвенный 1 связанные количесɬвом кальцинозов кальциноза количесɬво кальцинозов рассмаɬриваем признак ɮɭнкцию коɬорɭю опреɞелиɬь Ⱥналоɝично плоɬносɬь кальциноза значениями ((1) ɞоɛрокачесɬвенная являеɬся инɞивиɞɭальныɯ кальцинозов , кальцинозов , плоɬносɬи кальцинозов , . рассмаɬриваем ɮɭнкцию ɛыɬь опреɞелена ɞиаɝносɬики резɭльɬаɬе полɭчим ɞекомпозицию заɞачи ɛɭлевой ɮɭнкции эɬо преɞсɬавлено . 1. Бɭɞем слеɞɭющие имеюɬ ɛинарные значения 0 ɞоɛрокачесɬвенный , 1 кальцинозами ; ; преɞыɞɭщей ; ассоциированные резɭльɬаɬы исслеɞования моноɬонносɬь ɛыɬь использована ɞиаɝносɬики ɝрɭɞи Использɭя выше преɞсɬавиɬь клинические слɭчаи пяɬью (x клиническиɯ слɭчая преɞсɬавлены ɞвɭмя послеɞоваɬельносɬями : (10110) (10100). ɞиаɝносɬировал Рис (10100) злокачесɬвенный использɭя моноɬонносɬи ɬакже заключиɬь чɬо слɭчай (10110) ɬакже ɛыɬь злокачесɬвенным . 1. (10100) ɞва показания ɞля = 1 ( количесɬво кальцинозов ɭказание ); = 1 ( проɬоковая значение рак клиническом слɭчае (10110) наɛлюɞения преɞыɞɭщими (01010) поɞозриɬельно слɭчай (01000) счиɬаɬь поɞозриɬельным слɭчае признаков ɭказывающиɯ наличие Вышеɭпомянɭɬые сооɛражения сɭщесɬво слеɞовал законносɬь ɮɭнкция поɞɬвержɞена Бɭлева ɮɭнкция Бɭлева ɮɭнкция преɞсɬавление ɞиаɝносɬическиɯ Бɭлева ɮɭнкция преɞсɬавлена множесɬва правил неоɛязаɬельно Бɭлева ɮɭнкция ɞаɬь ɞиаɝносɬическɭю ɞискриминанɬнɭю ɮɭнкцию полɭчена шаɝами извлечения правил эксперɬа слеɞɭющие преɞсɬавиɬь как Бɭлевыɯ ɮɭнкций воссɬановиɬь кажɞɭю минимальной послеɞоваɬельносɬью оɛнарɭженные ɮɭнкции полнɭю ɞиаɝносɬическɭю ɮɭнкцию ˒˓ˈˇ˔˕˃˅ˋ˕˟ ˒ˑˎː˖ˡ ˗˖ːˍ˙ˋˡ ˍ˃ˍ ˕˓˃ˇˋ˙ˋˑːː˞ˌ ː˃˄ˑ˓ ˇˋ˃ˆːˑ˔˕ˋ˚ˈ˔ˍ ˋ˘ ˒˓˃˅ˋˎ ɞалее шаɝ воссɬановления Бɭлевой ɮɭнкции помощью минимальноɝо преɞɭсмаɬриваеɬ инɬервьюирование эксперɬа минимальной ɞинамической послеɞоваɬельносɬью послеɞоваɬельносɬь ɮɭнɞаменɬальной Hansel [Hansel G., 1966, Kovalerchuk B., Ta lianski V., 1996]. опɭскаем моɝɭɬ [Kovalerchuk B., Talianski V., 1996]. Оɛщая инɬеракɬивной процеɞɭры ɬаɛл послеɞоваɬельносɬь минимɭма Шенноновской ɮɭнкции минимальное количесɬво воссɬановиɬь самɭю сложнɭю моноɬоннɭю Бɭлевɭю ɮɭнкцию n арɝɭменɬами Послеɞоваɬельносɬь заранее Она зависиɬ преɞыɞɭщиɯ кажɞый послеɞɭющий иллюсɬрирɭеɬ эɬɭ послеɞоваɬельносɬь значения выше ɮɭнкций опɭскаем воссɬановление ɮɭнкции ), нɭжно воссɬановления ɮɭнкции самая чɬо ɮɭнкций начинаеɬся рассмоɬрения ɛинарныɯ (010), (110). ɬаɛлице Преɞсɬавляеɬ послеɞоваɬельносɬь (01100) слɭчай или (01100) = (x ). слеɞɭющий ɛɭɞеɬ слɭчая (01010). слеɞɭющий ɛɭɞеɬ поɞозриɬельносɬи слɭчая (11100). послеɞоваɬельносɬь слɭчайна ɭпомянɭɬо вывеɞено Hansel [Hansel G., 1966]. возможныɯ слɭчая ɛинарныɯ (x преɞсɬавлены сɝрɭппированы ɝрɭппы называюɬся Hansel [Hansel G., 1966]. Послеɞоваɬельносɬь цепей короɬкой 1 (01100) (11100). цепь ɞвɭɯ слɭчаев (01100) (11100). Наиɛольшая цепь 10 сосɬоиɬ 6 слɭчаев : (00000) (00001) (00011) (00111) (01111) (11111). ɋлɭчаи ɭпоряɞочены . ɬаɛл измерениями например использɭеɬся слеɞɭющий порожɞения сосɬоиɬ использовании ɬекɭщей i (i + 1)- размерной слеɞɭющеɝо (i + 1) резɭльɬаɬе слеɞɭющеɝо ˍˎˑːˋ˓˖ˈˏ 1-ˏˈ˓ː˖ˡ ˙ˈ˒˟ ȋ0Ȍ < ȋ1Ȍ ˋ ˒˓ˑˋˊ˅ˑˇˋˏ ˈˈ ˍˑ˒ˋˡ Пˑ˔ˎˈ ˠ˕ˑˆˑ ˏ˞ ː˃˓˃˜ˋ˅˃ˈˏ ˙ˈ˒˟, ˇˑ˄˃˅ˎˢˢ ˅˕ˑ˓ˑˈ ˋˊˏˈ˓ˈːˋˈ: ˙ˈ˒˟ 1 : ȋ00Ȍ < ȋ01Ȍ; ˙ˈ˒˟ 2 : ȋ10Ȍ < ȋ11Ȍ. ˑ˕ˇˈˎˢˈˏ ˆˎ˃˅ː˞ˌ ˔ˎ˖˚˃ˌ ȋ11Ȍ ˑ˕ ˙ˈ˒ˋ 2 ˋ ˇˑ˄˃˅ˎˢˈˏ ˈˆˑ ˅ ˍ˃˚ˈ˔˕˅ˈ ˆˑˎˑ˅˞ ˍ ˙ˈ˒ˋ 1, ˔ˑˊˇ˃˅˃ˢ ˇ˅ˈ 2-ˏˈ˓ː˞ˈ ˙ˈ˒ˋ: цепь 1 (00) (01) (11); цепь 2 (10). клонирɭем цепи (000) (001) (011); (100) (101) (111); (010) (110). Оɬɞеляем ɝлавный слɭчай (000) (001) (011) (111); (100) (101); (010) (110). клонирɭем цепи резɭльɬаɬе полɭчаем ɬаɛлицы 1. Ⱦинамическая послеɞоваɬельносɬь эксперɬом f Ɏорма плоɬносɬь кальцинозов Моноɬонное проɞолжение 1 0 1 3 4 5 6 7 8 (01100) 1* 1* 1.2;6.3;7.3 7.1;8.1 1 1.1 (11100) 1 1 6.4;7.4 5.1;3.1 1.2 (01010) 0* 1* 2.2;6.3;8.3 6.1;8.1 2 2.1 (11010) 1* 1 6.4;8.4 3.1;6.1 2.2 (11000) 1* 1* 3.2 8.1;9.1 3 3.1 (11001) 1 1 7.4;8.4 8.2;9.2 3.2 (10010) 0* 1* 4.2;9.3 6.1;9.1 4 4.1 (10110) 1* 1 6.4;9.4 6.2;5.1 4.2 (10100) 1* 1* 5.2 7.1;9.1 5 5.1 (10101) 1 1 7.4;9.4 7.2;9.2 5.2 (00010) 0 0* 6.2;10.3 10.1 6 6.1 (00110) 1* 0* 6.3;10.4 7.1 6.2 (01110) 1 1 6.4;10.5 6.3 (11110) 1 1 10.6 6.4 (00100) 1* 0* 7.2;10.4 10.1 7 7.1 (00101) 1 0* 7.3;10.4 10.2 7.2 (01101) 1 1* 7.4;10.5 8.2;10.2 7.3 (11101) 1 1 5.6 7.4 (01000) 0 1* 8.2 10.1 8 8.1 (01001) 1* 1 8.3 10.2 8.2 (01011) 1 1 8.4 10.3 8.3 (11011) 1 1 10.6 9.3 8.4 (10000) 0 1* 9.2 10.1 9 9.1 (10001) 1* 1 9.3 10.2 9.2 (10011) 1 1 9.4 10.3 9.3 (10111) 1 1 10.6 10.4 9.4 (00000) 0 0 10.2 10 10.1 (00001) 0* 0 10.3 10.2 (00011) 1* 0 10.4 10.3 (00111) 1 1 10.5 10.4 (01111) 1 1 10.6 10.5 (11111) 1 1 10.6 Вопросов 13 12 1 10, кажɞый слɭчай свой цепи Например вɬорой слɭчай цепи * сɬолɛцаɯ 2 3 маркирɭюɬ полɭченные слɭчая (01100) 2 чɬо Осɬающиеся ɞля самой 2 авɬомаɬически полɭчены f(01100) = 1 слɭчая 1.1 распросɬраняеɬся слɭчаи 1.2, 6.3 7.3, преɞсɬавленные колонке проɞолжения Ⱥналоɝично использɭя 1, вычисляюɬся значения моноɬонной Бɭлевой ɮɭнкции послеɞоваɬельносɬи (10010) инɬерпреɬирɭюɬся коɬорые использовались ɞля f. Hansel слɭчае 4 5 слɭчаи ɮɭнкций свойсɬвɭ ɋɬолɛец 4 преɞназначен ɞля расширения значений ɮɭнкции 1, 5 ɞля распросɬранения значений ɮɭнкции значением 0. ɞрɭɝой f(01100) = 0 0 2) слɭчаи 7.1 (00100) 8.1 (01000). слɭчаи перечислены 5 слɭчая (01100). Тоɝɞа неоɛɯоɞимосɬи спрашиваɬь слɭчаи 7.1 (00100) 8.1 (01000), слеɞɭюɬ f(01100) = 0 распросɬранен слɭчай f(11100), оɬносиɬельно ɮɭнкции f(11100). оɬрицаɬельный f(11100) = 0, значения моɝɭɬ слɭчаи 3.1, перечисленные сɬолɛце слɭчая 1.2. Оɛщее количесɬво слɭчаев знаком * сɬолɛце 1 13, 2 3 13 12. количесɬва показываюɬ 13 ɞля воссɬановления ɮɭнкции ɮɭнкций 12 вопросов воссɬановления ɮɭнкции ɮɭнкций воссɬановление 11 арɝɭменɬами опɬимизации = 2048 вопросов Hansel минимальный ɞиалоɝ ɞля воссɬановления Бɭлевой 11 арɝɭменɬами слеɞɭющеɝо 2.36 меньше 2048 вопросов 924 ɭменьшиɬь Ввеɞение ɭменьшаеɬ вопросов воссɬановления Бɭлевой ɮɭнкции 11 переменными 12+13+8 = 33 вопросов ɮɭнкции Полɭченная ɬаɛлица явно выписаɬь Бɭлевɭ ɮɭнкцию приняɬия сначала Бɭлевɭ ɮɭнкцию признака сɬолɛца слеɞɭя слеɞɭющим ː˃ˌ˕ˋ ˅˔ˈ ˏ˃ˍ˔ˋˏ˃ˎ˟ː˞ˈ ːˋˉːˋˈ ˈˇ ˋːˋ˙˞ ˇˎˢ ˅˔ˈ˘ ˙ˈ˒ˈˌ ˅ ˅ˋˇˈ ˠˎˈ исключиɬь изɛыɬочные ɬермины ɮормɭлы сɬолɛца = ∨ 5 . В ˙ˈ˒ˢ˘ 1-5, 8-9 ːˋˉːˋˏˋ ˈˇˋːˋ˙˃ˏˋ ˢ˅ˎˢˡ˕˔ˢ ˏˋːˋˏ˃ˎ˟ː˞ˈ ˠˎˈˏˈː˕˞ ˙ˈ˒ˈˌ, ˒ˑˠ˕ˑˏ˖ ˋˋ ˔ˑ˔˕ˑˢ˕ ˋˊ ˇ˅˖˘ ˠˎˈˏˈː˕ˑ˅ цепей оɞномɭ цепей 8-9, цепяɯ 6-7, 10 минимальными сооɬвеɬсɬвенно (01110), (01101), (00111), сооɬвеɬсɬвɭюɬ ˍˑː˝ˡːˍ˙ˋˋ ∨ Полɭченнɭю ɞизъюнкцию ɭпросɬим выражения 2 полɭчим Бɭлевɭ ɮɭнкцию переменныɯ ɞиаɝносɬики ɞизъюнкцию ɭпросɬим §·§· +=×= ¨¸¨¸ ©¹©¹ 1111 2462924 fȋšȌ = š ȋš ɮɭнкции инɬеракɬивном режиме полɭчили слеɞɭющɭю ɮɭнкцию Оɛъеɞиняя ɮɭнкции полɭчим Бɭлевɭ ɮɭнкцию )(y . эксперɬа Бɭлевой ɮɭнкции ɞиаɝносɬические Привеɞем ɞиаɝносɬическиɯ извлеченныɯ эксперɬа КОЛИЧЕɋТВО кальцинозов КОЛИЧЕɋТВО кальцинозов нереɝɭлярносɬь инɞивиɞɭальныɯ замеɬная КОЛИЧЕɋТВО кальцинозов КОЛИЧЕɋТВО кальцинозов ɛольшое изменение РȺЗМЕРЕ кальцинозов ИЗМЕНЕНИЕ плоɬносɬи кальцинозов ПЛОТНОɋТЬ кальциноза преɞсɬавляем ɞрɭɝие правила ɮормально w2&y1 w2&y2 w2&y3&y4&y5 w1&w3&y2 полносɬью преɞсɬавляюɬ эксперɬные знания извлеченные эксперɬа Бɭлевой ɮɭнкции f(x), моɝɭɬ ɛазɭ эксперɬнɭю ɞиаɝносɬическɭю Hansel G. Sur le nombre des fonctions Boolenes monotones den vari ables, C. R. Acad. Sci. Paris (in French). 1966. Vol. 262, 20. P. 10881090. Kovalerchuk B., Vityaev E., Ruiz J.F. Design of consistent system for radiologists to support breast cancer diagnosis // Joint Conf. of Information Sciences, Duke University, NC, 1997. Vol. 2. P. 118121. Kovalerchuk, B., Vityaev, E., Ruiz, J. Consistent Knowledge Discovery in Me dical Diagnosis. IEEE Engineering in Medicine and Biology Magazine. Sp ecial issue: Medical Data Mini ng, July / August, 2000. P. 2637. Kovalerchuk, B., Vityaev, E., Ruiz, J.F.

Приложенные файлы

  • pdf 34287905
    Размер файла: 304 kB Загрузок: 0

Добавить комментарий