Bisakah Anda Benar-Benar Mempercayai Aplikasi Medis di Ponsel Anda – Tidak pernah semudah ini untuk mendapatkan nasihat medis. Pencarian Google sederhana akan kembali dengan serangkaian gejala dan penyakit. Dokter telah pindah ke saku Anda dan ada semakin banyak aplikasi yang menjanjikan untuk memberikan diagnosis yang akurat.
Premis dari para dokter Google Play dan iOS App Store ini sederhana: sebuah aplikasi akan memberi Anda satu atau dalam beberapa kasus beberapa maka tanggung jawab ada pada Anda untuk mencari nasihat medis jika diperlukan.
Bisakah Anda Benar-Benar Mempercayai Aplikasi Medis di Ponsel Anda
Vidaone – “Ada berbagai jenis alat diagnostik di luar sana,” kata David Wong , dosen informatika kesehatan di Institut Informatika Kesehatan Leeds. Wong, bersama rekannya Hamish Fraser membantu saya menguji tiga aplikasi pemeriksa gejala berbasis kecerdasan buatan paling populer di Inggris: Ada, Your.MD, dan Babylon.
“Ada sejauh ini yang terbaik,” kata Wong. “Ada masalah dengan keduanya. Sangat mengejutkan dapat menemukan hal-hal yang salah dalam beberapa menit, dari perspektif non-klinis.”
Pasangan ini mengatakan perlu ada tata kelola yang lebih kuat di sekitar aplikasi semacam ini.
“Kekhawatiran besar adalah bahwa seseorang memasukkan informasi dan mereka memiliki penyakit serius dan mereka mendapatkan kepastian bahwa mereka baik-baik saja dan itu adalah situasi negatif palsu, yang dapat mengancam jiwa,” kata Fraser. Dia menambahkan bahwa secara umum ada beberapa pemeriksa gejala yang “cukup baik” yang tersedia.
Di Inggris Raya, Badan Pengatur Produk Obat dan Kesehatan (MHRA) mengklasifikasikan aplikasi yang membuat diagnosis medis sebagai perangkat medis.
Ini berarti mereka harus disertifikasi oleh agensi. Tetapi panduan MHRA mengatakan aplikasi seluler yang membuat “rekomendasi umum untuk mencari saran lebih lanjut” tidak mungkin perangkat medis dan, dengan demikian, tidak perlu memenuhi standar yang ditetapkan.
“Jika Anda memberi nasihat yang hidup atau mati, itu harus benar. Jika salah, siapa yang bertanggung jawab?” kata Wong.
Kembali pada tahun 2015, British Medical Journal menerbitkan sebuah penelitian yang mengevaluasi pemeriksa gejala yang digunakan untuk diagnosis diri.
Penelitian tersebut mengamati 23 pemeriksa gejala berbahasa Inggris dan menentukan apakah mereka mencantumkan diagnosis yang benar terlebih dahulu atau dalam hingga 20 opsi yang memungkinkan.
Untuk pemeriksa gejala yang kemudian menawarkan rekomendasi perawatan, para akademisi juga melihat jenis perawatan kesehatan yang direkomendasikan.
Pekerjaan tersebut menyimpulkan bahwa 34 persen dari waktu pemeriksa berhasil membuat diagnosis yang benar. Dalam 20 diagnosis teratas yang diberikan, 58 persennya benar.
Saran perawatan benar hampir dua pertiga kali (berkisar dari 33 persen hingga 78 persen). Studi ini tidak membandingkan bagaimana dokter manusia akan membuat rekomendasi atau diagnosis jika mereka diberikan informasi yang sama dengan pemeriksa.
Baca Juga : Teknologi Terus Mengubah Pendidikan Kesehatan
“Untuk pasien, hasil kami menyiratkan bahwa dalam banyak kasus pemeriksa gejala dapat memberi pengguna rasa kemungkinan diagnosis tetapi juga memberikan catatan kehati-hatian, karena alatnya sering salah dan saran triase terlalu berhati-hati,” studi menyimpulkan.
Itu juga menjelaskan bahwa pemeriksa gejala “mungkin” lebih bernilai daripada tidak mencari nasihat medis apa pun “atau hanya menggunakan mesin pencari internet”.
Tetapi mendapatkan nasihat yang baik tetap membingungkan. Direktori aplikasi NHS kacau, meskipun masih dalam versi beta.
Sejumlah aplikasi di situs web “Disetujui NHS” yang berarti mereka memiliki “bukti klinis yang mendukung hasil klinis”.
Yang lain ditandai sedang diuji oleh NHS, sementara beberapa tidak memiliki label atau rekomendasi sama sekali. Baik Your.MD atau Ada tidak terdaftar di situs web NHS, Babylon tidak secara khusus direkomendasikan.
Wong dan Fraser melangkah lebih jauh dalam evaluasi mereka terhadap industri pemeriksa gejala. “Standar emas untuk aplikasi perlu diubah pada kasus penggunaannya,” kata Wong.
Dia berpendapat bahwa jika aplikasi medis ditujukan untuk dokter dan ahli, maka aplikasi tersebut tidak dapat berfungsi sebaik yang seharusnya menginformasikan keputusan mereka daripada menjadi sumber yang sepenuhnya otoritatif.
Dengan aplikasi secara umum di Inggris, ada masalah dengan bagaimana hal-hal semacam ini diatur,” katanya, “Terutama karena teknologi bergerak lebih cepat daripada yang bisa diikuti oleh badan pengatur”.
Beri peringkat pada dokter AI
Bagaimana kami menguji : Uji ad-hoc WIRED melibatkan Ada, Your.MD (beta) dan Babylon. Ketiga aplikasi semuanya menawarkan beberapa bentuk pemeriksaan gejala dan empat penyakit umum diuji.
Gejala dari empat penyakit asma, herpes zoster, penyakit hati terkait alkohol, dan infeksi saluran kemih (ISK) diambil dari situs web NHS Choices dan dimasukkan pada aplikasi versi Android dan iOS. Kedua peneliti menguji aplikasi secara terpisah. Inilah yang terjadi.
Ada terpilih sebagai pemenang tes WIRED. Fraser mengatakan bahwa ia menanyakan tentang gejala yang paling penting, dan memberikan diagnosis terbaik. “Pertanyaannya jelas dan menerjemahkan teks bebas menjadi saran yang masuk akal bagi pengguna untuk memilih,” katanya.
Untuk asma ditanyakan tentang lamanya gejala meskipun tidak menanyakan tentang riwayat diagnosis atau potensi pemicunya.
Di ISK dia mengatakan ada “banyak pertanyaan bagus”. Secara keseluruhan Fraser mengatakan: “Diagnosis terbaik dari ketiganya, termasuk diagram bagus yang menunjukkan gejala mana untuk setiap penyakit yang ada dan kekuatan hubungannya, dan diagram jumlah orang dari sepuluh atau 100 yang kemungkinan memiliki diagnosis itu.”
“Sejak awal kami mulai membangun sesuatu yang memiliki pengetahuan medis mendalam yang mencakup kondisi langka serta kondisi umum yang umum,” kata pendiri Dr. Claire Novorol.
Dia menjelaskan bahwa Ada dimulai sebagai layanan platform untuk dokter dan kemudian diubah untuk fokus pada bagian-bagian yang dapat dipahami pasien.
“Kami sekarang menjadi platform yang menghubungkan pasien dan dokter. Di Inggris pada akhir penilaian, Anda dapat membagikan penilaian Anda dengan dokter, yang dibantu oleh teknologi yang menghadap dokter Ada di sisi platform mereka.”
Babel
Salah satu kekuatan Babel adalah kemampuannya untuk mengurai sinonim umum di sekitar ISK, kata Wong. Ini berarti ia dapat memahami bahwa “kencing, wee, dll” semuanya mengacu pada hal yang sama.
Namun, itu memang berada di bawah tes ad-hoc. Wong dan Fraser mengatakan itu memberikan tindakan untuk herpes zoster tetapi tidak menanyakan lebih banyak tentang gejala “yang bersangkutan”.
Wong mengatakan itu adalah yang paling tidak akurat dari tiga aplikasi tetapi menunjukkan bahwa pemeriksa gejala adalah tambahan untuk model bisnisnya yang lebih besar.
Babel awalnya mengatakan tidak ingin mengomentari perbandingan apa pun dengan layanan lain. Setelah publikasi, seorang juru bicara mengatakan versi aplikasi yang diuji untuk ini telah diperbarui.
“Untuk melakukan diagnosis komprehensif yang akurat secara bertanggung jawab, membutuhkan tingkat kemampuan AI yang lebih tinggi daripada yang saat ini tersedia untuk umum,” kata juru bicaranya, menambahkan bahwa perusahaan berencana untuk meluncurkan “produk inovatif” dalam beberapa bulan ke depan yang akan menggunakan AI untuk tidak hanya memberikan triase klinis, tetapi juga diagnosis.
Pada September 2017, Babylon menanggapi surat kritis di British Medical Journal dengan mengklaim pemeriksa gejala AI-nya telah “mengurangi konsultasi dokter umum pada hari yang sama sebesar 40 persen dengan memberikan perawatan alternatif yang tepat”.