Hoppa till innehåll

Ville Somppi, M-Files , om artificiell intelligens, kunskapsarbete och strukturerad kontra ostrukturerad data

Blogg-Ville-Somppi-Thumbnail-banner-1200x628

Artificiell intelligens (AI) förändrar kunskapsarbetet varje dag i takt med att varje ny innovation utvecklas snabbare och snabbare. Vi satte oss ner med Ville Somppi, Vice President of Industry Solutions på M-Files, för att prata om dessa förändringar, vad de innebär för kunskapsarbetarnas framtid och om (eller hur) AI kommer att hjälpa organisationer att överbrygga klyftan mellan strukturerad och ostrukturerad data.

Artificiell intelligens och framtidens arbete

Vissa företagsledare förutspår att AI kommer att eliminera arbete helt och hållet. Vilken inverkan tror du att AI kommer att ha på framtidens arbete?

AI kommer faktiskt att stärka den mänskliga uppfinningsrikedomen och kreativiteten. Datorer gör det du ber dem om. Om du har rätt fråga kommer en AI att veta svaret. När det gäller generativ AI är resultatet förmodligen halvvägs eller till och med 90 procent klart, förutsatt att du har en idé om vad som ska produceras. AI kommer att stärka arbetstagarna genom att skapa nya möjligheter för automatisering av kunskapsarbete.

AI kommer inte av en slump att veta vad den ska skapa - det måste finnas en person, en intelligent aktör, som ber den att göra något och sedan validerar att det innehåll som produceras är det som efterfrågas. Den långsamma delen i allt kreativt arbete, där du faktiskt måste producera tillgångar baserat på din ursprungliga idé, kommer att gå snabbare, men AI kommer inte att ersätta behovet av kunskapsarbetare som förverkligar en vision och använder sin kreativitet för att förverkliga visionen.

Resan mot automatisering av kunskapsarbete

När man talat om att optimera arbetsprestanda har det i allmänhet handlat om filhantering och processhantering som tar oss in i nästa fas av automatisering. Är denna utveckling ett resultat av bättre bandbredd och bearbetningshastigheter, och var detta alltid drömmen eller är detta ett skifte?

Detta har alltid varit drömmen, men det har varit en mycket långsam process. IT:s historia omfattar bara 50 eller 60 år. De första datorerna kunde knappt lagra data. Så småningom kom de grafiska gränssnitten ut på marknaden och vi hittade sätt att visualisera information på en skärm - inte bara på papper. Det grafiska användargränssnittet innebar att man inte behövde vara vetenskapsman för att förstå vad en dator gör, men viktiga uppgifter som dokumenthantering och arbetsflödeshantering var fortfarande helt manuella.

Visionen har alltid varit att automatisera kunskapsarbete och innovation för att göra allt arbete enklare - för att förbättra produktiviteten. Att be en dator att skapa något kräver bara talat eller skrivet språk. För flera decennier sedan kunde datorer göra riktigt häftiga, kraftfulla beräkningar eller simuleringar för att hjälpa till att utforma något så komplext som ett rymduppdrag till en annan galax. I morgon kommer du att kunna säga: "Hej, ChatGPT, kan du designa en rymdfarkost åt mig utifrån det här exemplet?" Istället för att spendera tusentals timmar med mus och tangentbord för att rita en 3D-ritning går det mycket snabbare att få fram ett fungerande designutkast att förfina. Du behöver inte förklara allt bokstavligt - det är det som är revolutionen.

Strukturerad kontra ostrukturerad data

Så många av våra system idag - från filhantering till affärsprocesser - handlar om handlar om strukturerad data som Word- eller PowerPoint-filer. Men tweets är juridiskt möjliga att hitta i domstol och räknas därför som ostrukturerade. När det gäller kunskapsarbete, finns det verkligen en skillnad mellan strukturerad och ostrukturerad data eller har den bara blivit helt suddig?

Traditionellt sett behöver datorer struktur för att förstå data. Låt oss säga att namnet på ditt företag bara är text. Ett strukturerat system som ett verktyg för hantering av kundrelationer (CRM) kan läsa ett ID-nummer som motsvarar ditt företagsnamn, och då bryr det sig bara om ID-numret och kommer alltid att veta vilket ID-nummer som representerar ditt företag. Ostrukturerade data som skrivs av människor, utan någon tydligt definierad innebörd, kommer en dator inte att förstå - det är bara text.

Med stora språkmodeller är strukturen mindre viktig eftersom datorer kan bearbeta ostrukturerad data mer effektivt för att extrahera mening och alla intressanta datapunkter. Säg att ett kontrakt gäller 2024. Om vi extraherar den tidsperioden som strukturerad data vet datorn när kontraktet gäller. Med generativ AI och dess inferensmotor kan du fråga vad ett visst objekt i en ostrukturerad tillgång betyder, och AI:n förstår eftersom den kan läsa och tolka ostrukturerat innehåll.

Det finns en skillnad mellan strukturerad och ostrukturerad data. Den ena är avsedd att läsas och förstås av datorer och den andra är fritt flödande - datorer har haft svårt att förstå den fram till nu. Det är mindre viktigt idag att ha allt som strukturerad data, men strukturerad data är fortfarande hur datorer pratar med varandra. Du kan inte riktigt beräkna frasen "kvart över tolv", eftersom en dator som standard bara ser text. En stor språkmodell kan konvertera det mänskliga uttrycket till strukturerad data som är begriplig för datorn, vilket gör att normala beräkningar kan utföras.

Betydelsen av informationsavsikt

Varför är strukturerad data lättare för datorer att använda och hur bearbetar M-Files ostrukturerad data?

Med strukturerade data har du inte bara värdet på data, du har också betydelsen, typen och informationsavsikten. En typ är t.ex. namnet på ett företag. Alla system som använder den datapunkten vet att beteckningen hänvisar till företagets namn och till datatypen. Strukturerad data kan hjälpa ett system att skilja mellan ett textfält och ett nummerfält. Och i ett sifferfält, vad betyder siffran? Är det en summa pengar eller ett postnummer? Med strukturerad data vet datasystemen vad du menar med en viss information.

Om du laddar upp ett kontrakt till M-Filesär det bara ett dokument. Det är ostrukturerat, det har skapats av människor, men vi kan extrahera intressanta datapunkter som strukturerade metadata. Eftersom M-Files kan tagga dokument med metadata som t.ex. avtalets giltighet kan vi omvandla delar av dessa ostrukturerade data till strukturerade data så att datorer kan bearbeta dem för att tillämpa affärsregler och möjliggöra alla typer av automatisering av kunskapsarbete.

Generativ AI kostar kapital

Påverkar dataformatet kostnaden för att använda generativ AI? Är ostrukturerad data dyrare att bearbeta, och har nya språkmodeller förändrat detta?

Att använda generativ AI kan bli dyrt eftersom datorn måste göra en hel del bearbetning för att förstå innehållet, för att sålla bland befintligt organisatoriskt kaos eller hitta en viss giltig avtalsperiod i motsats till om någon helt enkelt läser den informationen från metadata. Om du gör det en miljon gånger kommer du förmodligen att betala 50 000 dollar till det företag som tillhandahåller den generativa AI-tjänsten eftersom deras AI gör så mycket hårt arbete.

Men du kan göra det för alltid från ett strukturerat datafält och till låg kostnad eftersom det är trivialt. Stora språkmodeller är bara gigantiska matematiska formler som drivs av djupa neurala nätverk. Man matar in ett ingångsvärde och får ut ett utgångsvärde. Men kostnaden för att utföra den matematiska operationen är mycket hög jämfört med att bara göra normala saker som vi kunde göra för 50 år sedan.

Kostnadselementet är superviktigt. Vi kan inte bara ersätta all gammal IT och använda artificiell intelligens och generativ AI för allt, för det är ungefär en miljard gånger dyrare.

Jag har en smartphone här med mer datorkraft och mer kontroll över informationstekniken än vad alla superdatorer hade på 1990-talet. Stora språkmodeller och generativa AI:er som förstår språk är möjliga eftersom vi har så mycket mer datorkraft jämfört med tidigare - det gör det inte billigt, bara möjligt. Alla företag som tillämpar dessa tekniker måste göra en kostnads- och intäktsanalys. När ska vi använda den här häftiga, nya och dyra tekniken, i motsats till billigare, mer mekanisk och traditionell IT-teknik?

Senaste artiklarna

Bläddra bland ämnen

Sök

Bläddra till toppen