Förutsäg framtiden med Google Prediction API

För några veckor sedan så gick Google I/O av stapeln i San Fransisco och sin vana trogen så lanserade Google då en hel hög nya intressanta APIer. Då jag precis är tillbaka från min semester så har jag inte kunnat blogga om dessa APIer än, men nu är det dags. Det mest intressanta APIet som jag har sett på länge är det nya Prediction API (mer om det andra APIerna kommer i ett framtida blogginlägg).

Ladda upp data

Med Predictions API så kan man göra förutsägelser baserat på mönster i en stor datamängd, tex produktrekommendationer (please lovefilm ta en titt på det här!) eller hitta spam (något för Twitter). Först laddar man upp sin träningsdata till Google Storage (deras konkurrent till Amazon S3). Denna data måste vara formaterad i key-value pairs – om man laddar upp en massa emails så ska alltså alla mail som nämner hemliga Nigerianska bankkonton vara märkta som spam (Google använder detta API för att hitta spam redan).

Träna systemet

När man har laddat upp all sin data så kör man Predictions APIets träning så att APIet kan identifiera mönster. Exakt hur detta går till går inte Google in på, men tydligen har de ett stort antal machine learning algoritmer att välja på och de väljer automatiskt den algoritm som passar bäst för den givna datamängden.

Fråga systemet

Slutligen så kan man skicka in en fråga, tex texten på ett nytt email, och få tillbaka en förutsägelse (i detta fall om det är spam eller inte). Har man använt en stor mängd data av bra kvalitet så verkar man kunna få rätt bra resultat enligt vad jag har sett. Allt detta kan göras via REST, så det bör inte vara några större problem att integrera i vilken applikation som helst (när man får tillgång till APIet dvs).

För mer detaljer om detta högintressanta API så ta en titt på denna video. De börjar presentera Predictions API efter ca 25 minuter…

</embed>