Kaip pasikeitė kompiuterija

Jeanette Wing mano, kad patikimas AI ir priežastinis samprotavimas gali padėti visuomenei išspręsti realaus pasaulio problemas. Bet tai nebus lengva.

2021 m. spalio 27 d Jeannette Wing Kolumbijos universitete

Piteris Garritano

Atėjo laikas pradėti koncentruotis į duomenis, kad išspręstume savo problemas, sako vienas iš pirmaujančių pasaulyje duomenų mokslo ekspertų.



2006 m. Jeannette Wing, tuometinė Carnegie Mellon universiteto informatikos katedros vadovė, paskelbė įtakingą esė pavadinimu Kompiuterinis mąstymas, teigdamas, kad kiekvienam būtų naudinga naudoti koncepcinius kompiuterių mokslo įrankius sprendžiant problemas visose žmogaus veiklos srityse.

Skaičiavimo problema

Ši istorija buvo mūsų 2021 m. lapkričio mėn. numerio dalis

  • Žr. likusią numerio dalį
  • Prenumeruoti

Pati Wing niekada neketino studijuoti informatikos. Aštuntojo dešimtmečio viduryje ji įstojo į MIT siekti elektros inžinerijos, įkvėpta jos tėvo, šios srities profesoriaus. Kai ji sužinojo, kad domisi kompiuterių mokslu, ji paskambino jam ir paklausė, ar tai yra praeinanti mada. Juk lauke net vadovėlių nebuvo. Jis patikino, kad taip nėra. Wing pakeitė specialybę ir niekada nežiūrėjo atgal.

Buvęs įmonės „Microsoft Research“ viceprezidentas, o dabar Kolumbijos universiteto tyrimų vykdomasis viceprezidentas, Wing yra lyderis, propaguojantis duomenų mokslą įvairiose disciplinose.

Anil Ananthaswamy neseniai paklausė Wing apie jos ambicingą darbotvarkę skatinti patikimą dirbtinį intelektą, vieną iš 10 tyrimo iššūkių ji buvo identifikuota bandydama dirbtinio intelekto sistemas padaryti sąžiningesnes ir mažiau šališkas.

Kl.: Ar galėtumėte pasakyti, kad vyksta skaičiavimo būdo transformacija?

A: Visiškai. Moore'o įstatymas mus nuvedė ilgą kelią. Žinojome, kad pasieks Mūro dėsnio lubas, todėl lygiagretusis kompiuteris išpopuliarėjo. Tačiau fazių poslinkis buvo debesų kompiuterija. Originalios paskirstytos failų sistemos buvo savotiška debesų kompiuterija, kai failai nebuvo vietiniai jūsų kompiuteryje; jie buvo kažkur kitur serveryje. Debesų kompiuterija tai daro ir dar labiau sustiprina, kai duomenų nėra šalia jūsų; kompiuteris nėra šalia jūsų.

Kita pamaina susijusi su duomenimis. Ilgiausiai fiksavomės ties ciklais, todėl viskas veikia greičiau – procesoriai, centriniai procesoriai, GPU ir daugiau lygiagrečių serverių. Mes nepaisėme duomenų dalies. Dabar turime fiksuoti duomenis.

Klausimas: Tai duomenų mokslo sritis. Kaip jūs tai apibrėžtumėte? Kokie yra duomenų naudojimo iššūkiai?

KAM: Turiu labai glaustą apibrėžimą. Duomenų mokslas yra vertės iš duomenų išgavimo tyrimas.

Jūs negalite tiesiog pateikti man krūvos neapdorotų duomenų, o aš paspaudžiu mygtuką ir pasirodo vertė. Pradedama nuo duomenų rinkimo, apdorojimo, saugojimo, valdymo, analizės ir vizualizavimo, o vėliau rezultatų interpretavimo. Aš tai vadinu duomenų gyvavimo ciklu. Kiekvienas šio ciklo žingsnis yra daug darbo.

Kl.: Kai naudojate didelius duomenis, dažnai kyla susirūpinimas dėl privatumo, saugumo, sąžiningumo ir šališkumo. Kaip spręsti šias problemas, ypač AI?

KAM: Turiu šią naują mokslinių tyrimų darbotvarkę, kurią reklamuoju. Aš tai vadinu patikimu dirbtiniu intelektu, įkvėptu dešimtmečių pažangos, kurią padarėme patikimo skaičiavimo srityje. Patikimumas paprastai reiškia saugumą, patikimumą, prieinamumą, privatumą ir patogumą naudoti. Per pastaruosius du dešimtmečius padarėme didelę pažangą. Turime formalius metodus, kurie gali užtikrinti kodo dalies teisingumą; turime saugos protokolus, kurie padidina konkrečios sistemos saugumą. Ir mes turime tam tikras privatumo sąvokas, kurios yra formalizuotos.

Patikimas dirbtinis intelektas padidina priešiškumą dviem būdais. Staiga kalbame apie tvirtumą ir teisingumą – tai reiškia, kad jei trikdote įvestį, išvestis nebus labai trikdoma. Ir mes kalbame apie interpretuojamumą. Tai dalykai, apie kuriuos mes niekada nekalbėjome, kai kalbėjome apie kompiuteriją.

[Taip pat] AI sistemos yra tikimybinio pobūdžio. Praeities skaičiavimo sistemos iš esmės yra deterministinės mašinos: jos įjungtos arba išjungtos, teisingos ar klaidingos, taip arba ne, 0 arba vienas . Mūsų AI sistemų rezultatai iš esmės yra tikimybės. Jei pasakysiu, kad jūsų rentgeno nuotrauka sako, kad sergate vėžiu, tai, tarkime, 0,75 tikimybė, kad ta maža balta dėmė, kurią mačiau, yra piktybinė.

Taigi dabar turime gyventi šiame tikimybių pasaulyje. Matematiniu požiūriu tai naudoja tikimybinę logiką ir pateikia daug statistikos, stochastinių samprotavimų ir pan. Kaip kompiuterių mokslininkas, nesate išmokytas mąstyti tokiais būdais. Taigi dirbtinio intelekto sistemos tikrai apsunkino mūsų formalius argumentus apie šias sistemas.

Klausimas: Patikimas AI yra vienas iš 10 tyrimo iššūkių nustatėte duomenų mokslininkams. Atrodo, kad priežastinis ryšys yra dar vienas didelis.

A: Manau, kad priežastinis ryšys yra kita AI ir mašininio mokymosi riba. Šiuo metu mašininio mokymosi algoritmai ir modeliai yra tinkami ieškant modelių, koreliacijų ir asociacijų. Bet jie negali mums pasakyti: ar tai sukėlė tai? Arba jei aš tai daryčiau, kas nutiktų? Taigi kompiuterių moksle yra dar viena veiklos sritis, susijusi su priežastinėmis išvadomis ir priežastiniais samprotavimais. Statistikos bendruomenė dešimtmečius nagrinėjo priežastinį ryšį. Jie kartais šiek tiek susierzina kompiuterių mokslo bendruomenėje, galvodami, kad tai visiškai nauja idėja. Taigi noriu padėkoti statistikos bendruomenei už esminį indėlį į priežastinį ryšį. Didelių duomenų ir priežastinių samprotavimų derinys tikrai gali pajudinti sritį į priekį.

Klausimas: Ar džiaugiatės, ką duomenų mokslas gali pasiekti?

KAM: Visi žiūri į duomenų mokslą, nes mato, kad jų sritys keičiasi naudojant duomenų mokslo metodus skaitmeniniams duomenims, kuriuos jie dabar generuoja, gamina, renka ir pan. Tai labai jaudinantis laikas.

paslėpti