Sedert IBM Watson in 2007 begin het, het mense voortdurend die ontwikkeling van mediese kunsmatige intelligensie (KI) nagestreef. 'n Bruikbare en kragtige mediese KI-stelsel het enorme potensiaal om alle aspekte van moderne medisyne te hervorm, slimmer, meer akkurate, doeltreffende en inklusiewe sorg moontlik te maak, welstand vir mediese werkers en pasiënte te bring, en sodoende menslike gesondheid aansienlik te verbeter. In die afgelope 16 jaar, hoewel mediese KI-navorsers in verskeie klein velde opgehoop het, kon hulle op hierdie stadium nog nie wetenskapfiksie tot werklikheid bring nie.
Vanjaar, met die revolusionêre ontwikkeling van KI-tegnologie soos ChatGPT, het mediese KI in baie opsigte groot vordering gemaak. Ongekende deurbraak in die vermoë van mediese KI: Die Nature-joernaal het voortdurend die navorsing van mediese groottaalmodelle en mediese beeldbasiese modelle van stapel gestuur; Google stel Med-PaLM en sy opvolger vry, wat 'n kundige vlak in die Amerikaanse mediese praktisyn-eksamenvrae bereik. Groot akademiese tydskrifte sal op mediese KI fokus: Nature stel die vooruitsigte vir die basiese model van algemene mediese KI vry; Na 'n reeks oorsigte van KI in medisyne vroeër vanjaar, het die New England Journal of Medicine (NEJM) sy eerste digitale gesondheidsoorsig op 30 November gepubliseer en die eerste uitgawe van die NEJM-subjoernaal NEJM AI op 12 Desember bekendgestel. Die landingsgrond vir mediese KI is verder volwasse: Die JAMA-subjoernaal het die wêreldwye mediese beelddata-delingsinisiatief gepubliseer; Die Amerikaanse Food and Drug Administration (FDA) ontwikkel konsepriglyne vir die regulering van mediese KI.
Hieronder hersien ons die beduidende vordering wat navorsers regoor die wêreld gemaak het in die rigting van bruikbare mediese KI in 2023.
Mediese KI Basiese Model
Die konstruksie van die mediese KI-basiese model is ongetwyfeld die warmste navorsingsfokus vanjaar. Die Nature-joernale het gedurende die jaar oorsigartikels gepubliseer oor die Universele Basiese model van gesondheidsorg en die groot taalmodel van gesondheidsorg. Medical Image Analysis, die topjoernaal in die bedryf, het die uitdagings en geleenthede van basiese modelnavorsing in mediese beeldanalise hersien en daarna uitgesien, en die konsep van "stamboom van basiese model" voorgestel om die ontwikkeling van basiese modelnavorsing van mediese KI op te som en te lei. Die toekoms van basiese KI-modelle vir gesondheidsorg word al hoe duideliker. Deur gebruik te maak van die suksesvolle voorbeelde van groot taalmodelle soos ChatGPT, deur meer gevorderde selftoesighoudende vooropleidingsmetodes en 'n groot ophoping van opleidingsdata te gebruik, probeer navorsers op die gebied van mediese KI om 1) siektespesifieke basismodelle, 2) algemene basismodelle en 3) multimodale groot modelle te bou wat 'n wye reeks modusse met massiewe parameters en superieure vermoëns integreer.
Mediese Data-insameling KI-model
Benewens die groot KI-modelle wat 'n groot rol speel in die stroomaf kliniese data-analise take, het die tegnologie wat deur generatiewe KI-modelle verteenwoordig word, ook in die stroomop kliniese data-insameling na vore gekom. Die proses, spoed en kwaliteit van data-insameling kan aansienlik verbeter word deur KI-algoritmes.
Vroeër vanjaar het Nature Biomedical Engineering 'n studie van Turkye se Straits Universiteit gepubliseer wat gefokus het op die gebruik van generatiewe KI om die probleem van patologiese beeldondersteunde diagnose in kliniese toepassings op te los. Artefakte in bevrore snitweefsel tydens chirurgie is 'n hindernis vir vinnige diagnostiese evaluering. Alhoewel formalien- en paraffien-ingebedde (FFPE) weefsel 'n hoër kwaliteit monster verskaf, is die produksieproses daarvan tydrowend en neem dit dikwels 12-48 uur, wat dit ongeskik maak vir gebruik in chirurgie. Die navorsingspan het dus 'n algoritme genaamd AI-FFPE voorgestel, wat die voorkoms van die weefsel in die bevrore snit soortgelyk aan FFPE kan maak. Die algoritme het die artefakte van bevrore snitte suksesvol reggestel, die beeldkwaliteit verbeter en die klinies relevante kenmerke terselfdertyd behou. In kliniese validering verbeter die AI-FFPE-algoritme die diagnostiese akkuraatheid van patoloë vir tumorsubtipes aansienlik, terwyl die kliniese diagnosetyd aansienlik verkort word.
Cell Reports Medicine rapporteer navorsingswerk deur 'n span van die Derde Kliniese Kollege van die Jilin Universiteit, die Departement Radiologie, Zhongshan Hospitaal Verbonde aan Fudan Universiteit, en die Sjanghai Universiteit van Wetenskap en Tegnologie [25]. Hierdie studie stel 'n algemene doel diep leer en iteratiewe rekonstruksie fusie raamwerk (Hibried DL-IR) met hoë veelsydigheid en buigsaamheid voor, wat uitstekende beeldrekonstruksie prestasie in vinnige MRI, lae dosis CT, en vinnige PET toon. Die algoritme kan MR Enkel-orgaan multi-sekwensie skandering in 100 sekondes bereik, die stralingsdosis tot slegs 10% van die CT-beeld verminder, en geraas uitskakel, en kan klein letsels van PET verkryging met 2 tot 4 keer versnelling rekonstrueer, terwyl die effek van bewegingsartefakte verminder word.
Mediese KI in samewerking met mediese werkers
Die vinnige ontwikkeling van mediese KI het mediese professionele persone ook daartoe gelei om ernstig te oorweeg en te verken hoe om met KI saam te werk om kliniese prosesse te verbeter. In Julie vanjaar het DeepMind en 'n multi-institusionele navorsingspan gesamentlik 'n KI-stelsel genaamd Complementary Driven Clinical Workflow Delay (CoDoC) voorgestel. Die diagnostiese proses word eers gediagnoseer deur 'n voorspellende KI-stelsel, dan beoordeel deur 'n ander KI-stelsel op grond van die vorige resultaat, en indien daar twyfel is, word die diagnose uiteindelik deur 'n klinikus gemaak om diagnostiese akkuraatheid en balansdoeltreffendheid te verbeter. Wat borskankersifting betref, het CoDoC vals positiewe koerse met 25% verminder met dieselfde vals negatiewe koers, terwyl die kliniese werklas met 66% verminder is, in vergelyking met die huidige "dubbellees-arbitrasie"-proses in die VK. Wat TB-klassifikasie betref, is vals positiewe koerse met 5 tot 15 persent verminder met dieselfde vals negatiewe koers in vergelyking met onafhanklike KI en kliniese werkvloeie.
Net so het Annie Y. Ng et al., van Kheiron Company in Londen, VK, addisionele KI-lesers (in samewerking met menslike eksaminatore) bekendgestel om die resultate weer te ondersoek wanneer daar geen herroepingsresultate in die dubbellees-arbitrasieproses was nie, wat die probleem van gemiste opsporing in vroeë borskankersifting verbeter het, en die proses het byna geen vals positiewe resultate gehad nie. Nog 'n studie, gelei deur 'n span aan die Universiteit van Texas McGovern Mediese Skool en voltooi by vier beroerte-sentrums, het KI-tegnologie gebaseer op rekenaartomografie-angiografie (CTA) toegepas om die opsporing van groot vaskulêre okklusiewe iskemiese beroerte (LVO) te outomatiseer. Klinici en radioloë ontvang binne minute nadat CT-beelding voltooi is, intydse waarskuwings op hul selfone, wat hulle in kennis stel van die moontlike teenwoordigheid van LVO. Hierdie KI-proses verbeter werkvloei in die hospitaal vir akute iskemiese beroerte, wat die deur-tot-lies-tyd van opname tot behandeling verminder en geleenthede vir suksesvolle redding bied. Die bevindinge is gepubliseer in JAMA Neurology.
'n KI-gesondheidsorgmodel vir universele voordeel
2023 sal ook baie goeie werk sien wat mediese KI gebruik om kenmerke te vind wat onsigbaar is vir die menslike oog uit meer geredelik beskikbare data, wat universele diagnose en vroeë sifting op skaal moontlik maak. Aan die begin van die jaar het Nature Medicine studies gepubliseer wat gedoen is deur die Zhongshan Eye Center van Sun Yat-sen Universiteit en die Tweede Geaffilieerde Hospitaal van Fujian Mediese Universiteit. Deur slimfone as toepassingsterminale te gebruik, het hulle spotprentagtige videobeelde gebruik om kinders se blik te veroorsaak en kinders se blikgedrag en gesigstrekke op te neem, en verder abnormale modelle geanaliseer met behulp van diep leermodelle om 16 oogsiektes suksesvol te identifiseer, insluitend aangebore katarakte, aangebore ptose en aangebore gloukoom, met 'n gemiddelde siftingsakkuraatheid van meer as 85%. Dit bied 'n effektiewe en maklik-populariseerbare tegniese middel vir die grootskaalse vroeë sifting van baba-visuele funksie-inkorting en verwante oogsiektes.
Aan die einde van die jaar het Nature Medicine verslag gedoen oor werk wat deur meer as 10 mediese en navorsingsinstellings regoor die wêreld gedoen is, insluitend die Sjanghai Instituut vir Pankreasiekte en die Eerste Geaffilieerde Hospitaal van die Zhejiang Universiteit. Die outeur het KI toegepas op die sifting van pankreaskanker van asimptomatiese mense in fisiese ondersoeksentrums, hospitale, ens., om die letselkenmerke in gewone CT-beelde op te spoor wat moeilik is om met die blote oog alleen op te spoor, om sodoende doeltreffende en nie-indringende vroeë opsporing van pankreaskanker te bewerkstellig. In die hersiening van data van meer as 20 000 pasiënte het die model ook 31 gevalle van klinies gemiste letsels geïdentifiseer, wat kliniese uitkomste aansienlik verbeter het.
Deling van mediese data
In 2023 het baie meer perfekte data-delingsmeganismes en suksesvolle gevalle regoor die wêreld na vore gekom, wat multisentrum-samewerking en data-openheid verseker onder die uitgangspunt van die beskerming van dataprivaatheid en -sekuriteit.
Eerstens, met die hulp van KI-tegnologie self, het KI-navorsers bygedra tot die deel van mediese data. Qi Chang en ander van Rutgers Universiteit in die Verenigde State het 'n artikel in Nature Communications gepubliseer, waarin hulle 'n federale leerraamwerk, DSL, voorstel gebaseer op verspreide sintetiese teenstrydige netwerke, wat generatiewe KI gebruik om die spesifieke gegenereerde data van multisentrums op te lei, en dan die werklike data van multisentrums met die gegenereerde data vervang. Verseker KI-opleiding gebaseer op multisentrum-groot data terwyl dataprivaatheid beskerm word. Dieselfde span maak ook 'n datastel van gegenereerde patologiese beelde en hul ooreenstemmende aantekeninge oopbron. Die segmenteringsmodel wat op die gegenereerde datastel opgelei is, kan soortgelyke resultate as die werklike data behaal.
Die span van Dai Qionghai van die Tsinghua Universiteit het 'n artikel oor npj Digital Health gepubliseer, waarin hulle Relay Learning voorstel, wat groot data van verskeie terreine gebruik om KI-modelle op te lei onder die uitgangspunt van plaaslike datasoewereiniteit en geen netwerkverbinding tussen terreine nie. Dit balanseer datasekuriteit en privaatheidskwessies met die nastrewing van KI-prestasie. Dieselfde span het vervolgens gesamentlik CAIMEN ontwikkel en gevalideer, 'n pan-mediastinale tumordiagnosestelsel vir borskas-CT gebaseer op federale leer, in samewerking met die Eerste Geaffilieerde Hospitaal van die Guangzhou Mediese Universiteit en 24 hospitale regoor die land. Die stelsel, wat op 12 algemene mediastinale gewasse toegepas kan word, het 44,9 persent beter akkuraatheid behaal wanneer dit alleen gebruik word as wanneer dit deur menslike kundiges alleen gebruik word, en 19 persent beter diagnose-akkuraatheid wanneer menslike kundiges daardeur bygestaan is.
Aan die ander kant is verskeie inisiatiewe aan die gang om veilige, globale, grootskaalse mediese datastelle te bou. In November 2023 het Agustina Saenz en ander van die Departement Biomediese Informatika aan die Harvard Mediese Skool aanlyn in Lancet Digital Health 'n globale raamwerk vir die deel van mediese beelddata, genaamd Artificial Intelligence Data for All Healthcare (MAIDA), gepubliseer. Hulle werk saam met gesondheidsorgorganisasies regoor die wêreld om omvattende leiding te gee oor data-insameling en de-identifikasie, deur die Amerikaanse Federale Demonstrasievennoot (FDP)-sjabloon te gebruik om data-deling te standaardiseer. Hulle beplan om geleidelik datastelle wat in verskillende streke en kliniese omgewings regoor die wêreld versamel is, vry te stel. Die eerste datastel sal na verwagting vroeg in 2024 vrygestel word, met meer wat sal kom namate die vennootskap uitbrei. Die projek is 'n belangrike poging om 'n globale, grootskaalse en diverse stel publiek beskikbare KI-data te bou.
In die nasleep van die voorstel het die UK Biobank 'n voorbeeld gestel. Die UK Biobank het op 30 November nuwe data vrygestel van die volledige genoomvolgordebepaling van sy 500 000 deelnemers. Die databasis, wat die volledige genoomvolgorde van elk van die 500 000 Britse vrywilligers publiseer, is die grootste volledige menslike genoomdatabasis ter wêreld. Navorsers regoor die wêreld kan toegang tot hierdie gedeïdentifiseerde data aanvra en dit gebruik om die genetiese basis van gesondheid en siekte te ondersoek. Genetiese data was nog altyd hoogs sensitief vir verifikasie in die verlede, en hierdie historiese prestasie van die UK Biobank bewys dat dit moontlik is om 'n oop, privaatheidsvrye wêreldwye grootskaalse databasis te bou. Met hierdie tegnologie en databasis sal mediese KI die volgende sprong inlui.
Verifikasie en Evaluering van Mediese KI
In vergelyking met die vinnige ontwikkeling van mediese KI-tegnologie self, is die ontwikkeling van verifikasie en evaluering van mediese KI effens stadig. Validering en evaluering in die algemene KI-veld ignoreer dikwels die werklike vereistes van klinici en pasiënte vir KI. Tradisionele gerandomiseerde beheerde kliniese proewe is te moeisaam om die vinnige iterasie van KI-instrumente te ewenaar. Die verbetering van die verifikasie- en evalueringstelsel wat geskik is vir mediese KI-instrumente so gou as moontlik is die belangrikste ding om mediese KI te bevorder om navorsing en ontwikkeling werklik na kliniese landing te lei.
In Google se navorsingsartikel oor Med-PaLM, gepubliseer in Nature, het die span ook die MultiMedQA-evalueringsmaatstaf gepubliseer, wat gebruik word om die vermoë van groot taalmodelle om kliniese kennis te bekom, te assesseer. Die maatstaf kombineer ses bestaande professionele mediese V&A-datastelle, wat professionele mediese kennis, navorsing en ander aspekte dek, sowel as 'n aanlyn soektog-mediese vraagdatabasisdatastel, wat dokter-pasiënt aanlyn V&A in ag neem, en probeer om KI vanuit baie aspekte in 'n gekwalifiseerde dokter op te lei. Daarbenewens stel die span 'n raamwerk voor gebaseer op menslike assessering wat verskeie dimensies van feite, begrip, redenasie en moontlike vooroordeel in ag neem. Dit is een van die mees verteenwoordigende navorsingspogings om KI in gesondheidsorg te evalueer wat vanjaar gepubliseer is.
Beteken die feit dat groot taalmodelle 'n hoë vlak van kodering van kliniese kennis toon egter dat groot taalmodelle bekwaam is vir werklike kliniese take? Net soos 'n mediese student wat die professionele geneesheer-eksamen met 'n perfekte telling slaag, nog ver van 'n solo-hoofgeneesheer is, is die evalueringskriteria wat deur Google voorgestel word, dalk nie 'n perfekte antwoord op die onderwerp van mediese KI-evaluering vir KI-modelle nie. Reeds in 2021 en 2022 het navorsers verslagdoeningsriglyne soos Decid-AI, SPIRIT-AI en INTRPRT voorgestel, in die hoop om die vroeë ontwikkeling en validering van mediese KI te lei onder voorwaarde dat faktore soos kliniese praktiese toepassing, veiligheid, menslike faktore en deursigtigheid/interpreteerbaarheid in ag geneem word. Onlangs het die tydskrif Nature Medicine 'n studie gepubliseer deur navorsers van die Universiteit van Oxford en Stanford oor die gebruik van "eksterne validering" of "herhalende plaaslike validering" om KI-instrumente te valideer.
Die onbevooroordeelde aard van KI-instrumente is ook 'n belangrike evalueringsrigting wat vanjaar aandag gekry het in beide Science- en NEJM-artikels. KI toon dikwels vooroordeel omdat dit beperk is tot opleidingsdata. Hierdie vooroordeel kan sosiale ongelykheid weerspieël, wat verder ontwikkel in algoritmiese diskriminasie. Die Nasionale Instituut van Gesondheid het onlangs die Bridge2AI-inisiatief van stapel gestuur, wat na raming $130 miljoen sal kos, om diverse datastelle te bou (in lyn met die doelwitte van die MAIDA-inisiatief wat hierbo genoem is) wat gebruik kan word om die onbevooroordeeldheid van mediese KI-instrumente te valideer. Hierdie aspekte word nie deur MultiMedQA oorweeg nie. Die vraag van hoe om mediese KI-modelle te meet en te valideer, benodig steeds uitgebreide en diepgaande bespreking.
In Januarie het Nature Medicine 'n opiniestuk gepubliseer met die titel "The Next Generation of Evidence-Based Medicine" deur Vivek Subbiah van die Universiteit van Texas MD Anderson Cancer Center, wat die beperkings van kliniese proewe wat in die konteks van die COVID-19-pandemie blootgelê is, hersien en die teenstrydigheid tussen innovasie en nakoming van die kliniese navorsingsproses uitwys. Laastens wys dit op 'n toekoms van herstrukturering van kliniese proewe – die volgende generasie kliniese proewe wat kunsmatige intelligensie gebruik, dit wil sê die gebruik van kunsmatige intelligensie uit 'n groot aantal historiese navorsingsdata, werklike wêrelddata, multimodale kliniese data, draagbare toesteldata om sleutelbewyse te vind. Beteken dit dat KI-tegnologie en KI-kliniese valideringsprosesse in die toekoms wedersyds versterk en saam ontwikkel? Dit is die oop en gedagteprikkelende vraag van 2023.
Regulering van Mediese KI
Die vooruitgang van KI-tegnologie hou ook uitdagings in vir die regulering van KI, en beleidmakers regoor die wêreld reageer versigtig en versigtig. In 2019 het die FDA vir die eerste keer 'n Voorgestelde Regulatoriese Raamwerk vir Sagtewareveranderinge aan Kunsmatige Intelligensie Mediese Toestelle (Besprekingskonsep) gepubliseer, wat die potensiële benadering tot die voorbemarkingshersiening van KI en masjienleergedrewe sagtewarewysigings uiteensit. In 2021 het die FDA die "Kunsmatige Intelligensie/Masjienleer-gebaseerde Sagteware as 'n Mediese Toestel Aksieplan" voorgestel, wat vyf spesifieke KI mediese regulatoriese maatreëls verduidelik het. Hierdie jaar het die FDA die Voorbemarkingsvoorlegging vir Toestelsagtewarekenmerke heruitgereik om inligting te verskaf oor voorbemarkingsvoorleggingsaanbevelings vir die FDA se evaluering van die veiligheid en doeltreffendheid van toestelsagtewarekenmerke, insluitend sommige sagtewaretoestelkenmerke wat masjienleermodelle gebruik wat deur masjienleermetodes opgelei is. Die FDA se regulatoriese beleid het ontwikkel van 'n aanvanklike voorstel tot praktiese leiding.
Na die publikasie van die Europese Gesondheidsdataruimte in Julie verlede jaar, het die EU weereens die Wet op Kunsmatige Intelligensie ingestel. Eersgenoemde is daarop gemik om gesondheidsdata optimaal te benut om hoëgehalte-gesondheidsorg te verskaf, ongelykhede te verminder en data te ondersteun vir voorkoming, diagnose, behandeling, wetenskaplike innovasie, besluitneming en wetgewing, terwyl verseker word dat EU-burgers groter beheer oor hul persoonlike gesondheidsdata het. Laasgenoemde maak dit duidelik dat die mediese diagnosestelsel 'n hoërisiko-KI-stelsel is, en dit moet geteikende sterk toesig, toesig oor die hele lewensiklus en toesig oor voor-evaluering aanneem. Die Europese Medisyne-agentskap (EMA) het 'n konsep-refleksiedokument gepubliseer oor die gebruik van KI om geneesmiddelontwikkeling, -regulering en -gebruik te ondersteun, met die klem op die verbetering van die geloofwaardigheid van KI om pasiëntveiligheid en die integriteit van kliniese navorsingsresultate te verseker. Oor die algemeen neem die EU se regulatoriese benadering geleidelik vorm aan, en die finale implementeringsbesonderhede kan meer gedetailleerd en streng wees. In skrille teenstelling met die EU se streng regulering, maak die VK se KI-regulatoriese bloudruk duidelik dat die regering beplan om 'n sagte benadering te volg en nie nuwe wetsontwerpe in te stel of nuwe reguleerders op te stel nie.
In China het die Mediese Toestel Tegniese Hersieningsentrum (NMPA) van die Nasionale Mediese Produkte Administrasie voorheen dokumente uitgereik soos "Hersieningspunte van Diep Leer Ondersteunde Besluitnemingsagteware", "Leidende Beginsels vir die Registrasie Hersiening van Kunsmatige Intelligensie Mediese Toestelle (Konsep vir Kommentaar)" en "Omsendbrief oor Leidende Beginsels vir die Klassifikasie en Definisie van Kunsmatige Intelligensie Mediese Sagtewareprodukte (No. 47 in 2021)". Hierdie jaar is die "Opsomming van die eerste resultate van die klassifikasie van mediese toestelle in 2023" weer vrygestel. Hierdie reeks dokumente maak die definisie, klassifikasie en regulering van mediese sagtewareprodukte vir kunsmatige intelligensie duideliker en makliker om te gebruik, en bied duidelike leiding vir die produkposisionering en registrasiestrategieë van verskeie ondernemings in die bedryf. Hierdie dokumente bied 'n raamwerk en bestuursbesluite vir die wetenskaplike regulering van KI-mediese toestelle. Dit is die moeite werd om uit te sien na die agenda van die China Mediese Kunsmatige Intelligensie-konferensie wat van 21 tot 23 Desember in Hangzhou gehou is, wat 'n spesiale forum oor digitale mediese bestuur en hoëgehalte-ontwikkeling van openbare hospitale en die forum vir die standaardisering van mediese toestelle vir kunsmatige intelligensie opstel. Op daardie tydstip sal amptenare van die Nasionale Ontwikkelings- en Hervormingskommissie en die NMPA die vergadering bywoon en moontlik nuwe inligting vrystel.
Gevolgtrekking
In 2023 het mediese KI begin integreer in die hele mediese stroomop- en stroomaf-proses, wat hospitaaldata-insameling, samesmelting, analise, diagnose en behandeling, en gemeenskapsondersoeke insluit, en organies saamwerk met mediese/siektebeheerwerkers, wat die potensiaal toon om welstand vir menslike gesondheid te bring. Bruikbare mediese KI-navorsing begin deurbreek. In die toekoms hang die vordering van mediese KI nie net af van die tegnologiese ontwikkeling self nie, maar benodig ook die volle samewerking van die industrie, universiteit en mediese navorsing en die ondersteuning van beleidmakers en reguleerders. Hierdie kruisdomein-samewerking is die sleutel tot die bereiking van KI-geïntegreerde mediese dienste, en sal beslis die ontwikkeling van menslike gesondheid bevorder.
Plasingstyd: 30 Desember 2023




