О стандартизации, погрешности и доверии в медицине
Волею судеб возник вопрос, который я за всю свою жизнь не слышал никогда и ни от кого.
Почему-то ответ на него в обществе считается сам собой разумеющимся и непогрешимым.
Но прежде чем я его обрисую - небольшая предыстория.
Наверное, у всех в школе были нелюбимые предметы, о которых думалось, что они никогда в жизни не пригодятся. У меня таким предметом были лабораторные по физике. Ну действительно: сделал три измерения и уже примерно понятно, в чем суть того или иного эксперимента. Зачем ещё полчаса тратить на такие же 100500 измерений? А потом ещё несколько часов считать погрешности и объяснять их...
Какая скука. Никогда бы не хотел этим в жизни заниматься.
А потом был универ, и там было целое море --разноцветных амфетаминов, барбитуратов и транквилизаторов-- различных физических экспериментов с расчетом этих самых погрешностей.
После универа наконец-то можно было о забыть - мне так думалось до недавнего времени.
Заболел живот, решил сдать анализ крови на паразитов. Первый раз сдал и один из показателей был подозрительным.
Надо было повторить тест через 2 недели. Че-то интереса ради да и для уверенности решил сдать этот тест одновременно в двух разных лабораториях. Ну почти одновременно: с разницей в полчаса - ровно столько идти от одной лабы до другой.
Больше прозой мучить не буду - вот часть сравнения результатов:
Считалось всё грубо - всё-таки у меня не бесконечно денег и крови: за среднее значение бралось среднее арифметическое между анализами, за относительную погрешность - отношение абсолютной погрешности к среднему. Было бы больше результатов и известны их плотности распределения - посчитал бы точнее.
Вопрос тут даже не в самих результатах, а в процессе их получения и интерпретации.
Вопрос, который я в самом начале поста хотел задать звучит так: Почему мед.лабам наслово все верят, что результаты верны, хотя нет строгой стандартизации результатов?
Да, обе лабы дали ответ, что всё хорошо, паразитов нет, но...
1) Почему цифры отличаются от 20 до 41%? Там же всего полчаса прошло между сдачами крови.
2) Почему одна из лабораторий утверждает о 100% "чувствительности и специфичности" своей тест-системы, а другая вообще о ней не упоминает, зато говорит о "прохождении сертификации системы менеджмента"?
3) Почему единицы измерения отличаются, а референсные интервалы - нет?
Если это одно и то же, так и писали бы одинаково. Зачем разные названия для одной сущности придумывать?
Представьте себя на месте врача, у которого на осмотр пациента есть 20 минут. Надо опросить пациента, понять, какая была история болезни, если ее нет, посмотреть анализы, и выдать пациенту какое-то заключение - дополнительное обследование, выписать лекарства или просто выдать рекомендацию по образу жизни.
Когда на стол кладут сотню разных цифр да ещё и с разными единицами измерения, очень велик шанс ошибиться или недосмотреть какой-то показатель.
Там точно 20 минут не хватит. Как результат, из-за недостатка времени врач просто психологически будет обращать внимание только на выделенный текст в анализах и, может быть, на свой жизненный опыт.
Какой смысл тогда на медфаках рассказывать про референсные интервалы? Они всё равно будут разными от лаборатории к лаборатории из-за разных единиц измерения. Говорили б тогда в ВУЗах проще: вышло за интервал - болен, не вышло - здоров. А границы интервалов пусть лаборатории определяют.
Я, когда первый раз пост писал, думал, что достаточно гиперболизировал этот бред, но потом посмотрел внимательнее на результаты:
Даже референсные интервалы иногда отличаются от лабы к лабе! Это как раз то, что называется отсутствием стандартизации. Как итог - все цифры разные, причем одна по верхней границе, а вторая почти по нижней.
И это даже не между разными странами различие, а между разными кварталами в пределах одного города.
4) И самое главное: где, блять, погрешности и описание используемых приборов и материалов?! Этому ещё в школе учат. Между разными лабами часть результатов оказывается невоспроизводимой, несмотря на все 100% "чувствительности и специфичности" и сертификаты системы менеджмента.
Например, в анализе по эхинококку заявляется, что если цифра меньше 0.85, то эхинококк не обнаружен, а если больше 1, то обнаружен.
В то же время относительная погрешность 26% в моем результате означает, что одна лаба могла выдать 0.71 - и это бы значило отсутствие эхинококка, а другая - 1.13 - это уже присутствие эхинококка. И как тогда это интерпретировать? Как ложно-положительный или как ложно-отрицательный результат? Понятно, что формулы расчета этих значений могут быть сложны и нелинейны, но тогда и выдавать надо не одно единственное число, а левую и правую границу интервала, в котором находится результат.
Обвинений, наверное, хватит.
Побуду теперь адвокатом этих лабораторий - не зря же 5 лет объяснял расхождения эксперимента с теорией.
Прежде всего надо отметить, что общий анализ крови (ОАК) с высокой степенью точности совпадает между этими лабами. Но остается вопрос: почему другие анализы могут настолько сильно различаться? Причин может быть много:
1) Погрешности приборов и методическая погрешность. Что-то могло быть неоткалибровано перед проведением анализа или формулы неточны.
2) Человеческий фактор. Лаборанту могло быть просто лениво делать столь длительный анализ и он решил тупо нарисовать цифры из головы в соответствии с принятой в регионе статистикой заболеваемости.
3) Систематическая погрешность измерения. Уровень разных иммуноглобулинов у каждого человека может варьироваться в зависимости от времени суток или состояния человека. Полчаса ходьбы между лабами могли существенно повлиять на результаты. С другой стороны, если полчаса ходьбы влияют на результаты, то эта погрешность должна быть уже заложена в результат: клиент же не на стационаре находится, чтобы в определенное время брать у него анализы. Человек сам не знает, когда и какой из тысячи параметров изменится. Не может он сказать: "пойду медкомиссию проходить попозже, а то с утра у меня холестерин высокий".
4) Разная методика измерений и представление результата. Тот случай, когда одно и то же название соответствует физически разным величинам. Например, если известно, что какая-то величина с 6:00 до 12:00 уменьшается в 2 раза, человек сдает анализ в 11:00, а осмысленные результаты получаются для 6:00, то встает вопрос: что писать в результате? То значение, которое было на момент взятия анализа или пересчитанное на 6:00? С одной стороны, надо писать всегда ровно то, что получилось не зависимо от времени анализа. К этому относятся все маломеняющиеся величины типа гемоглобина или холестерина - любое изменение уровня свидетельствует об изменениях в организме. С другой стороны, есть гормоны типа тестостерона и мелатонина, уровень которых меняется довольно сильно от времени суток, а клиенты вряд ли придут, если будешь брать кровь только с 6:00 до 7:00. Приходится чем-то жертвовать: или точностью, или заработком. Как баланс между ними может выступать пересчет результатов к некоторому среднему значению, если зависимости хорошо известны.
Первую причину можно устранить более частой калибровкой и сверкой приборов.
Вторую причину можно устранить путем исключения человеческого труда - пусть машины делают максимум работы, а оператор только калибрует их и загружает материал.
Третью причину можно устранить путем учета большего количества неявных параметров - времени сдачи биоматериала и возраста клиента, например.
Четвертая причина решается путем явного указания того, как именно получились результаты. Хотя бы краткое название методики измерений нужно указывать.
Еще хочу подчеркнуть проблему сличительных испытаний между мед.лабораториями. Тупо нет такого ОТКРЫТОГО реестра лабораторий, в котором можно было бы любому человеку посмотреть, когда та или иная лаба проходила испытания, что сравнивалось и с кем. Как минимум, гугл о нем не знает: есть только информация о тех, кто проводит сличительные испытания, но не о результатах. Скиньте, пожалуйста, ссылку на этот реестр в комментах, если вы знаете.
Резюмируя, могу сказать, что не всем цифрам можно верить, иногда стоит перепроверять результаты. Также, просьба к лабораториям - указывайте погрешности, методику измерений и оборудование. Ну и остается надеяться, что реестр сличительных испытаний будет когда-нибудь проиндексируется гуглом и наконец стандартизируют тесты.
Напоследок одно интересное видео на тему точности тестов: