Технология распознавания речи в лучевой диагностике: длительность подготовки заключений
РезюмеТехнология распознавания речи получает все большее распространение в отечественной системе здравоохранения. Однако у профессионального врачебного сообщества остаются вопросы об эффективности применения голосового ввода для заполнения медицинской документации. Рентгенология стала одной из первых медицинских специальностей, где было проведено широкомасштабное внедрение технологии распознавания речи.
Цель нашего исследования - оценить эффективность применения технологии распознавания речи при подготовке протоколов разных типов рентгенологических исследований.
Материал и методы. Ретроспективное исследование было проведено на базе Московского референс-центра ГБУЗ "НПКЦ ДиТ ДЗМ". В исследование методом простой случайной выборки было включено 12 912 протоколов рентгенологических исследований, подготовленных 67 врачами-рентгенологами за май-ноябрь 2022 г. В исследование были включены следующие типы исследований: флюорография, диагностическая маммография, компьютерные томограммы (КТ) органов грудной клетки при подозрении на новую коронавирусную инфекцию COVID-19, магнитно-резонансные томограммы (МРТ) головного мозга с контрастированием и КТ органов грудной клетки, брюшной полости и малого таза с контрастированием. Для заполнения протоколов рентгенологических исследований использовалось программное обеспечение Voice2Med. Межгрупповое сравнение выполнено с помощью U-критерий Манна-Уитни с уровнем статистической значимости 0,05.
Результаты. Средняя длительность подготовки протоколов флюорографического исследования в группе клавиатурного ввода составила 189,9 с (0:03:09), в группе голосового ввода - 236,2 с (0:03:56) (p<0,0001), для маммографических исследований - 387,1 (0:06:27) и 444,8 с (0:07:24) (p<0,0001), для рентгенографических исследований - 247,8 (0:04:07) и 189,0 с (0:03:09) (p<0,0001), для КТ органов грудной клетки - 379,7 (0:06:19) и 382,7 с (0:06:22) (p=0,12), для МРТ головного мозга - 709,9 (0:11:49) и 559,9 с (0:09:19) (p<0,0001) и для КТ органов грудной полости, брюшной полости и органов малого таза с контрастированием - 2714,6 (0:45:15) и 1778,4 с (0:29:38) соответственно.
Заключение. Применение технологии распознавания речи при подготовке протоколов рентгенологических исследований продемонстрировало разную эффективность. Наименьшая результативность была получена при подготовке протоколов скрининговых исследований (флюорография и маммография). Наибольшая результативность была достигнута при подготовке протоколов КТ и МРТ.
Ключевые слова:технология распознавания речи; подготовка заключений; хронометражное исследование; отделение лучевой диагностики
Финансирование. Данная научная работа подготовлена авторским коллективом в рамках НИР "Научно-методические основы цифровой трансформации службы лучевой диагностики" (№ ЕГИСУ: № 123031400118-0) в соответствии с Приказом от 21.12.2022 № 1196 "Об утверждении государственных заданий, финансовое обеспечение которых осуществляется за счет средств бюджета города Москвы, государственным бюджетным (автономным) учреждениям, подведомственным Департаменту здравоохранения города Москвы, на 2023 год и плановый период 2024 и 2025 годов" Департамента здравоохранения города Москвы.
Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов.
Вклад авторов. Написание текста, сбор и обработка материалов, анализ полученных данных - Кудрявцев Н.Д.; концепция и дизайн исследования - Владзимирский А.В.
Для цитирования: Кудрявцев Н.Д., Владзимирский А.В. Технология распознавания речи в лучевой диагностике: длительность подготовки заключений // ОРГЗДРАВ: новости, мнения, обучение. Вестник ВШОУЗ. 2023. Т. 9, № 2. С. 64-73. DOI: https://doi.org/10.33029/2411-8621-2023-9-2-64-73
Полноценное, качественное и своевременное заполнение медицинской документации играет важную роль в принятии правильных врачебных решений. В ряде исследований продемонстрировано, что врачи тратят 37-72% своего рабочего времени именно на заполнение медицинской документации [1-4]. Протокол рентгенологического исследования является основным методом коммуникации врачей-рентгенологов с лечащими врачами пациентов. Увеличивающаяся рабочая нагрузка на врачей-рентгенологов, связанная с увеличением количества диагностических исследований и их объема, приводит к сокращению времени, которое врач может затратить на подготовку протоколов исследований, что непосредственно сказывается на качестве подготовленных медицинских документов.
Возникшая ситуация от организаторов здравоохранения требует оптимизации кадровых и материально-технических ресурсов, в том числе за счет внедрения инновационных технологий. Одним из решений может стать применение технологии распознавания речи, которая все активнее используется в отечественном здравоохранении [5, 6]. Данная технология позволяет автоматически распознавать, преобразовывать речь врача в текст и заполнять поля медицинского документа. Результаты научных исследований продемонстрировали, что голосовое заполнение ускоряет процесс заполнения медицинской документации для разных медицинских специальностей, в том числе в рентгенологии [7, 8].
В нашем предыдущем исследовании оценивалось влияние технологии распознавания речи только для результатов компьютерной (КТ) и магнитно-резонансной томографии (МРТ) [4], а в большинстве зарубежных исследований сравнивается длительность заполнения протоколов рентгенологических исследований при участии медицинского транскрипциониста и с помощью технологии распознавания [7].
Таким образом, цель нашего исследования - оценка влияния технологии распознавания речи на длительность подготовки протоколов исследований для различных рентгенологических модальностей.
Материал и методы
Ретроспективное исследование было проведено на базе Московского референс-центра ГБУЗ "НПКЦ ДиТ ДЗМ". В исследование методом простой случайной выборки было включено 12 912 протоколов рентгенологических исследований, подготовленных 67 врачами-рентгенологами в Едином радиологическом информационном сервисе в составе Единой медицинской информационно-аналитической системы Москвы (ЕРИС ЕМИАС) за май-ноябрь 2022 г. В исследование были включены: флюорография, диагностическая маммография, КТ органов грудной клетки при подозрении на новую коронавирусную инфекцию COVID-19, МРТ головного мозга с контрастированием и КТ органов грудной клетки, брюшной полости и малого таза с контрастированием. Распределение по типам рентгенологических исследований представлено в табл. 1.
В рамках исследования проводился анализ данных из ЕРИС ЕМИАС: наименование диагностического исследования, дата и время начала подготовки протокола исследования, дата и время визирования протокола исследования, ФИО врача, проводившего подготовку протокола.
Критерии включения: протоколы, подготовленные с помощью традиционного (клавиатурного) или голосового ввода, протоколы с описанием патологических изменений, протоколы, подготовленные врачами с опытом применения технологии распознавания речи не менее 6 мес.
Критерии исключения: протоколы, не имеющие описание патологических изменений, протоколы исследований длительность подготовки которых составила <1 мин (60 с) (для флюорографических исследований - <10 с) и >1 ч (3600 с), протоколы, в подготовке которых принимало участие более одного врача, протоколы, подготовка которых проводилась в несколько этапов.
Программное обеспечение для голосового ввода: для заполнения протоколов рентгенологических исследований с помощью технологии распознавания речи использовалось система голосового ввода Voice2Med (версия 4.1.1052.18, ООО "ЦРТ", Санкт-Петербург, Россия).
Методы статистического анализа. Обработка полученных данных была выполнена с использованием методов описательной статистики с указанием следующих характеристик: число значений (N), среднее арифметическое (Mean), стандартное отклонение (SD), минимум (Min), максимум (Max), медиана (Med), первый и третий квартили (Q1, Q3), межквартильный интервал (IQR). Для определения типа распределения данных использовался тест Колмагорова-Смирнова, а также среди проверяемых распределений были распределение Бернулли, биноминальное распределение, распределение Коши, распределение χ2, лог-нормальное, логистическое и отрицательное биноминальное распределение, распределение Стьюдента и Вейбулла, равномерное распределение, гамма-распределение и распределение Пуассона (по результатам анализа данные длительности заполнения протоколов рентгенологических исследований не соответствовали ни одному из вышеперечисленных типов распределения). Межгрупповое сравнение выполнено с помощью U-критерий Манна-Уитни с уровнем статистической значимости 0,05. Обработка данных проводилась с помощью языка программирования R в среде RStudio (Version 4.2.1, RStudio, Inc.) [9].
Результаты
Флюорография. Средняя длительность подготовки протокола в группе клавиатурного ввода составила 189,9 с (0:03:09), в группе голосового ввода - 236,2 с (0:03:56). Медиана длительности описания в 1-й и во 2-й группах составила 107,0 (0:01:47) и 139,5 с (0:02:19) соответственно. Гистограммы длительности описания исследований представлены на рис. А. Продолжительность интерпретации результатов флюорографических исследований при использовании клавиатурного ввода была меньше, различия оказались статистически значимы (p<0,0001). Описательная статистика данных по длительности подготовки протоколов флюорографических исследований представлена в табл. 2.
По результатам исследования средняя длительность подготовки протоколов флюорографических исследований при использовании клавиатурного ввода оказалась меньше на 19,6%, медиана - на 23,3%, чем при использовании технологии распознавания речи.
Диагностическая маммография. Средняя длительность подготовки протокола в группе клавиатурного ввода составила 387,1 с (0:06:27), в группе голосового ввода - 444,8 с (0:07:24). Медиана длительности подготовки протокола в 1-й и во 2-й группах составила 224,0 (0:03:44) и 271,0 с (0:04:31) соответственно. Диаграммы длительности описания исследования представлены на рис. Б. Продолжительность интерпретации результатов флюорографических исследований при использовании клавиатурного ввода была меньше, различия оказались статистически значимы (p<0,0001). Описательная статистика данных по длительности подготовки протоколов флюорографических исследований представлена в табл. 3.
По результатам исследования средняя длительность подготовки протоколов маммографических исследований при использовании клавиатурного ввода оказалась меньше на 14,9%, медиана - на 21,0%, чем при использовании технологии распознавания речи.
Рентгенографические исследования с целью диагностики травматических переломов. Средняя длительность подготовки протокола в группе клавиатурного ввода составила 247,8 с (0:04:07), в группе голосового ввода - 189,0 с (0:03:09). Медиана длительности подготовки протокола в 1-й и во 2-й группах составила 146,0 (0:02:26) и 107,0 с (0:01:47) соответственно. Диаграммы длительности описания исследования представлены на рис. В. Продолжительность интерпретации результатов рентгенографических исследований при использовании системы голосового ввода была меньше, различия оказались статистически значимы (p<0,0001). Описательная статистика данных по длительности подготовки протоколов рентгенографических исследований представлена в табл. 4.
По результатам исследования средняя длительность подготовки протоколов рентгенографических исследований с помощью технологии распознавания речи оказалась меньше на 23,7%, медиана - на 26,7%, чем при использовании клавиатурного ввода.
КТ органов грудной клетки при подозрении на COVID-19. Средняя длительность подготовки протокола в группе клавиатурного ввода составила 379,7 с (0:06:19), в группе голосового ввода - 382,7 с (0:06:22). Медиана длительности подготовки протокола в 1-й и во 2-й группах составила 271,0 (0:04:31) и 275,0 (0:04:35) с соответственно. Диаграмма длительности описания исследования в зависимости от группы представлена на рис. Г. Описательная статистика данных по длительности подготовки протоколов флюорографических исследований представлена в табл. 5.
При анализе результатов достоверного различия длительности подготовки протоколов КТ-исследований органов грудной клетки с помощью клавиатурного и голосового ввода не получено (p=0,12).
МРТ головного мозга. Средняя длительность подготовки протокола в группе клавиатурного ввода составила 709,9 с (0:11:49), в группе голосового ввода - 559,9 с (0:09:19). Медиана длительности подготовки протокола в 1-й и во 2-й группах составила 486,0 (0:08:06) и 354,0 (0:05:54) соответственно. Гистограмма длительности описания исследования в зависимости от группы представлена на рис. Д. Продолжительность интерпретации результатов МРТ головного мозга с контрастированием при использовании голосового ввода была меньше, различия оказались статистически значимы (p<0,0001). Описательная статистика данных по длительности подготовки протоколов МРТ головного мозга с контрастированием представлена в табл. 6.
По результатам исследования средняя длительность подготовки протоколов МРТ головного мозга с контрастированием при применении технологии распознавания речи уменьшилась на 21,4%, медиана - на 27,2%.
КТ органов грудной полости, брюшной полости и органов малого таза с контрастированием. Средняя длительность подготовки протокола в группе клавиатурного ввода составила 2714,6 с (0:45:15), в группе голосового ввода - 1778,4 с (0:29:38). Медиана длительности подготовки протокола в 1-й и во 2-й группах составила 2114,0 (0:35:14) и 1369,0 с (0:22:49) соответственно. Гистограмма длительности описания исследования представлена на рис. Е. Продолжительность интерпретации результатов КТ органов грудной полости, брюшной полости и органов малого таза с контрастированием при использовании голосового ввода была меньше, различия оказались статистически значимы (p<0,0001). Описательная статистика данных по длительности подготовки протоколов КТ органов грудной полости, органов брюшной полости и органов малого таза с контрастированием представлена в табл. 7.
Средняя длительность подготовки протоколов КТ при применении технологии распознавания речи уменьшилась на 34,5%, медиана - на 35,2%.
Обсуждение
Полученные результаты демонстрируют разную эффективность применения системы голосового ввода при подготовке протоколов рентгенологических исследований. По нашему мнению, это связано с различными типами протоколов, используемых при описании диагностических исследований.
С одной стороны, применение системы голосового ввода замедлило время подготовки протоколов маммографических исследований. Это объясняется применением в медицинских организациях Департамента здравоохранения г. Москвы структурированного электронного медицинского документа (СЭМД) для описания результатов маммографических исследований.
Применение СЭМД в совокупности со стандартизированной шкалой BI-RADS позволяет улучшить коммуникацию между специалистами разного профиля и оптимизировать процесс принятия решения о дальнейшей тактике ведения пациентов [10, 11]. Схожий результат наблюдался во время использования технологии распознавания речи при подготовке протоколов флюорографических исследований. Однако применение СЭМД препятствует использованию системы голосового ввода.
При описании КТ органов грудной клетки у пациентов с подозрением на новую коронавирусную инфекцию COVID-19 система голосового ввода не повлияла на длительность процесса подготовки протоколов исследований. Это можно объяснить гибридным типом протокола, в котором присутствует как структурированная, стандартизированная часть, так и поле свободного ввода для описания дополнительных находок [12]. Стандартизированная и структурированная части протокола, содержащие информацию о локализации, распространении, объеме поражения и характере изменений паренхимы легких, значительно ускоряют процесс заполнения медицинского документа. Поле свободного ввода требовало от врачей ручного или голосового заполнения выявленных дополнительных находок.
Наибольшую эффективность система голосового ввода продемонстрировала при подготовке протоколов МРТ головного мозга и КТ органов грудной клетки, брюшной полости и малого таза. При подготовке протоколов подобного типа исследований врачи используют нарративный метод описания. Такие исследования зачастую содержат большое количество патологических изменений, как целевых, так и случайных находок, что требует от врача-рентгенолога их детального описания в медицинском документе. В подтверждение этого стоит отметить, что среднее значение и медиана длительности подготовки протоколов для вышеописанных КТ и МРТ имели наибольшее значение в обеих группах при сравнении с длительностью подготовки протоколов других типов исследований. Основная сложность стандартизации протоколов вышеуказанных исследований заключается в большой вариабельности возможных патологических изменений и отсутствии единого общепринятого словаря рентгенологической терминологии [10]. Однако нами уже была предпринята попытка разработки подобного словаря для применения совместно с системой голосового ввода при описании протоколов КТ [13].
Отдельно стоит отметить эффективность применения системы голосового ввода при подготовке протоколов рентгенографических исследований, проведенных в травматологических пунктах. Это связано с тем, что при описании таких исследований используются протокол со свободным полем ввода, где врач-рентгенолог в 2-3 предложениях, применяя нарративный метод, интерпретирует рентгенологические находки.
Полученные результаты сложно сравнить с зарубежными исследованиями по данному научному направлению. Ранее в некоторых зарубежных странах применялась отличная от отечественной методология подготовки протоколов рентгенологических исследований. Врачи-рентгенологи производили аудиозаписи с помощью диктофона, которые в дальнейшем расшифровывали и переводили в текстовый формат медицинские транскрипционисты. Подавляющее большинство современных зарубежных исследований подтверждает эффективность применения технологии распознавания речи при сравнении с результатами, полученными от медицинских транскрипционистов [7, 8].
Система голосового ввода является новым инструментом для российских врачей-рентгенологов. По результатам опроса, 62,8% врачей-рентгенологов отметили, что технология распознавания речи повышает эффективность работы вне зависимости от типа рентгенологических исследований, которые они описывают [14]. Можно предположить, что для части специалистов вербальный тип подготовки медицинской документации может быть более приемлем в связи с их индивидуально-психологическими чертами. Данная гипотеза требует дальнейшего изучения.
Заключение
Применение системы голосового ввода при подготовке протоколов рентгенологических исследований продемонстрировало разную эффективность. Для структурированных и стандартизированных протоколов, которые применяются при описании результатов маммографических и флюорографических исследований, технология оказалась неэффективна. Наибольшая результативность был достигнута при подготовке протоколов КТ и МРТ, которые зачастую содержат большое количеством патологических изменений и требуют объемного описания выявленных рентгенологических находок.
Литература
1. Вечорко В.И. Распределение рабочего времени на амбулаторном приеме врача-терапевта участкового с медицинской сестрой в поликлинике города Москвы (фотохронометражное наблюдение) // Социальные аспекты здоровья населения. 2016. Т. 52, № 6. С. 4.
2. Каплиева О.В. и др. Хронометраж рабочего времени врачей детского консультативно-диагностического отделения // Дальневосточный медицинский журнал. 2018. № 4. С. 72-76.
3. Рябчиков И.В. и др. Распределение рабочего времени на амбулаторном приема врача травматолога-ортопеда // Московский хирургический журнал. 2018. № 6. С. 38-43.
4. Кудрявцев Н.Д. и др. Оценка эффективности внедрения технологии распознавания речи для подготовки протоколов рентгенологических исследований // Врач и информационные технологии. 2020. № 51. С. 40-47.
5. Технология распознавания речи помогла врачам заполнить более 210 тысяч протоколов лучевых исследований [Электронный ресурс] // Официальный сайт Мэра Москвы. 2023. URL: https://www.mos.ru/news/item/118060073/ (дата обращения: 09.01.2023).
6. Храмцов А.И., Насыров Р.А., Храмцова Г.Ф. Применение цифровых технологий в работе патологоанатома: обучение использованию систем автоматического распознавания речи // Педиатр (Санкт-Петербург). 2021. Т. 12, № 3. С. 63-68.
7. Hammana I. et al. Speech recognition in the radiology department: a systematic review // Health Inf. Manag. 2015. Vol. 44, N 2. P. 4-10.
8. Poder T.G., Fisette J.-F., Déry V. Speech recognition for medical dictation: overview in Quebec and systematic review // J. Med. Syst. 2018. Vol. 42, N 5. P. 89.
9. Team R.C. R: A language and environment for statistical computing [Electronic resource]. Vienna : R Foundation for Statistical Computing, 2013. URL: http://www.r-project.org/ (date of access January 09, 2023).
10. Синицын В.Е., Комарова М.А., Мершина Е.А. Структурированные протоколы описания в лучевой диагностике // Вестник рентгенологии и радиологии. 2014. № 6. С. 47-52.
11. Ganeshan D. et al. Structured reporting in radiology // Acad. Radiol. 2018. Vol. 25, N 1. P. 66-73.
12. Морозов С.П. и др. Лучевая диагностика коронавирусной болезни (COVID-19): организация, методология, интерпретация результатов. Версия 2 (17.04. 2020). 2020.
13. Андрианова М.Г., Кудрявцев Н.Д., Петряйкин А.В. Разработка тезауруса рентгенологических терминов для голосового заполнения протоколов диагностических исследований // Digital Diagnostics. 2022. Т. 3, № 1S. С. 21-22.
14. Кудрявцев Н.Д. и др. Технология распознавания речи: результаты опроса врачей-рентгенологов Московского референс-центра лучевой диагностики // ОРГЗДРАВ: новости, мнения, обучение. Вестник ВШОУЗ. 2022. Т. 8, № 3. С. 95-104.