sabato 30 ottobre 2010

Perchè fermarsi quando c'è tanto altro da scoprire?

Si dice che fra poco entreremo nell'era degli Zettabyte (1 miliardo di Terabyte). Che ormai è il termine numerico adeguato per misurare il traffico internet. Ma è pensabile che esistano ambienti analitici di tali dimensioni? Molte aziende clienti di Teradata lavorano con Terabyte di dati e riescono a realizzare cose incredibili. Che senso ha disporre di enormi volumi di dati, tanto per averli? Uno Zettabyte equivale a 1024 Exabyte, che a sua volta equivale a 1024 Petabyte, e il Petabyte club è ancora oggi un circolo molto esclusivo riservato ai clienti Teradata - anche se l'ammontare dei dati in loro possesso cresce ad un ritmo pazzesco. Che interesse possono avere a collezionare così tanti dati? Ci sarà pure un momento in cui una mole di dati così smisurata diventa un ostacolo ai fini analitici invece che essere un'opportunità, oppure no?

Ascoltando i “big guys”, non si ha l'impressione che si preoccupino molto delle dimensioni. I grandi volumi di dati sembrano piuttosto essere la loro palestra per sperimentare nuovi tecniche e per allenarsi in vista di nuove sfide. Mentre molti architetti di data warehouse si dedicano anima e corpo a progettare interventi in regime di economia, queste aziende sono impegnate a non farsi sfuggire neppure i minimi dettagli. Oliver Ratzesberger di eBay ha portato l'esempio di un suo collega che dice che non bisogna mai buttar via alcun dato, perché non sai mai quello che ti potrà servire in futuro. Il punto della questione è avere i dati pronti quando l'idea di business giusta arriva, invece di dover aspettare altri 12 o 30 mesi per raccogliere il materiale necessario ai vari test.

Questa sembra essere la differenza essenziale tra il Petabyte club e tutti gli altri, l'attitudine che così spesso li posiziona più avanti degli altri: stanno smettendo di utilizzare i dati per avere conferme di quello che già sanno per concentrarsi sulla scoperta di cose davvero nuove. Questo impone loro di acquisire dati di alta qualità e fine dettaglio piuttosti che dati riepilogativi. Ad esempio, memorizzare informazioni sulle transazioni di denaro permette di isolare e identificare modelli a lungo termine. Ma è l'interazione che un cliente ha con la società prima e durante l'acquisto che racconta tutta la storia, specialmente quando la vendita non dovesse aver luogo alla fine del processo – che è forse il caso più interessante. Sui siti web dei semplici dettagli di usability si possono rivelare generatori di vendite di massa. Ma voi non ne sarete a conoscenza, a meno di monitorare e analizzare le interazioni con i clienti. I membri del Petabyte club lavorano con l'obiettivo di essere in grado di accorgersene al momento opportuno.

La lezione da imparare da questi giganti è che quando si progetta un data warehouse e si pensa al reporting e a un po' di analisi ha senso guardare anche al di là dei primi anni. In una fase successiva, una volta che l'azienda avrà imparato a fare pieno uso delle proprie capacità di analisi e di conseguanza a porre un sempre maggior numero di domande al dipartimento di analisi dei dati, sarà finalmente in grado di prevedere, reagire e attivare eventi di business. Un esempio calzante è il settore delle telecomunicazioni. Alcuni anni fa molti avevano dubbi sui vantaggi di memorizzare i dettagli delle chiamate. Oggi la realtà è che chi non è in grado di analizzare questi dati perchè non li possiede, probabilmente faticherà persino a rimanere nel business visto che i suoi concorrenti, che quei dati invece li hanno, avranno un grande vantaggio competitivo.

Lo stesso sta accadendo con i dati OSS. Questi dati si stanno rivelando estremamente utili se si vuole comprendere che esperienza stanno facendo i vostri clienti con i vostri servizi. Ci sono, ad esempio, colli di bottiglia dovuti alla larghezza di banda che spingono i clienti ad andarsene dal vostro sito? E non c'è modo di individuare questi problemi in tempo reale e risolverli subito? Beh, certo che c'è, a meno che abbiate deciso di rinunciare a catturare quei dati in dettaglio.

Vale la pena di tenere bene a mente questa lezione, dato che tipologie di dati come quelli originati dai social media e da tutte le altre nuove fonti di dati stanno per essere integrati negli analytics di livello enterprise. Un semplice assortimento di dati non basta a fare primeggiare un'azienda nel proprio campo e sono perfettamente consapevole che questo potrebbe essere una sfida enorme per molte imprese: se gestire Petabyte di dati è stato come rompere il muro del suono, passare al livello Zettabyte è come cercare di viaggiare alla velocità della luce. E allora, rifacendomi a Freddy Mercury, il consiglio è Don't Stop – mai fermarsi e continuare a oltrepassare i limiti per arrivare a nuovi risultati e nuovi successi! Sono sicuro che nei prossimi 3-5 anni ne vedremo delle belle.

giovedì 28 ottobre 2010

Socializzazione alla Partners Conference di Teradata

Oggi Darryl McDonald ha esposto il suo concetto di socializzazione dei dati (i momenti di socializzazione sono un elemento chiave di ogni conferenza, che strano che finora non abbiamo mai pensato a questo tipo di dati!). Se volete sentirlo direttamente dalla voce di Darryl lo potete fare qui. In molti si sono incuriositi riguardo questo argomento dopo il mio post di ieri, quindi proverò a spiegarvelo così come io l’ho capito.


Darryl fondamentalmente sostiene che per trarre valore dai propri dati, ci sono 3 passi necessari da fare: integrare, esplorare e condividere tali dati. Questo è esattamente ciò che si fa con i database di qualsiasi dimensione, sia che si stia utilizzando un semplice data mart o un vero e proprio data warehouse aziendale. Per dirla con parole mie, il messaggio di Darryl è che ormai siamo abituati a costruire piccoli mondi in miniatura – alcuni più grandi, altri più piccoli – e tendiamo ad accontentarcene, mentre invece nel mondo reale i dati stanno virtualmente esplodendo. Darryl ha utilizzato come esempi i social media, i dispositivi mobili e i sensori. Non appena le aziende cominciano ad interessarsene, tutte queste fonti di dati rivelano le loro enormi potenzialità di business. Al momento siamo nel bel mezzo di questo processo che nei prossimi 2 o 3 anni si farà anche più intenso.

Quello che Darryl ha voluto dire con il suo discorso, è che dobbiamo percorrere nuove vie per trovare e cogliere nuove opportunità. Teradata sta fornendo i mezzi tecnici per farlo.


Il tutto si riduce a quello che chiamo “gap di realizzazione”, che si manifesta perché negli anni passati ci è stato detto (in puro stile didattico...) che l’innovazione è guidata dal business: ci serve, quindi lo inventiamo.

Al contrario io credo che i cambiamenti nel business saranno guidati dalle nuove tecnologie, e non viceversa. Teniamo presente che i dispositivi mobili e i dati geospaziali sono arrivati prima di quei servizi location-based ora tanto apprezzati.

Stephen Brobst, CTO di Teradata, passando quasi inosservato aveva previsto tutto questo appena 18 mesi fa. Questo gap è stato colmato ad un ritmo pazzesco.


Ma tornando agli aspetti tecnici, i 3 livelli integrazione-esplorazione-condivisione dei dati ci hanno proposto una sfida molto interessante.

Da un lato sappiamo che per una comprensione approfondita è necessario integrare i nuovi dati con quelli già esistenti – per esempio, proporre a ciascun cliente offerte adeguate basandosi solo sui dati relativi alla loro ubicazione geografica non è certo sufficiente! Dall'altro lato c’è una varietà completamente nuova sia di tipi di dati, sia di strumenti analitici specializzati in queste tipologie di dati. Questo è il motivo per cui Teradata ha speso tante energie nell’integrazione con gli strumenti dei propri partner e per cui stiamo testando nuove modalità di collaborazione con le nostre piattaforme.

A detta di Darryl, per sostenere la visione di un ecosistema aziendale aperto sia ai dati che alle persone, tutto è utile: dalle in-database analytics ai laboratori di dati e all’LDM unificato fino all’allineamento con i sistemi Hadoop.


Noi di Teradata stiamo rendendo possibili le opportunità di business del domani grazie all’idea ben chiara di quali dati vengono generati e al fatto che stiamo rendendo disponibili tali dati per l’analisi. La piattaforma di socializzazione dei dati di Darryl è il nostro contributo concreto in risposta alla sfida e, allo stesso tempo, lo strumento che ci permette di stimolare tutti quei pionieri che sono pronti a cogliere le nuove opportunità.

Dopo tutto le idee non nascono dall’incontro di persone diverse, ciascuno con retroterra culturali e sociali diversi?


Per ora è tutto. Se invece state cercando ispirazioni d’altro tipo, date un’occhiata ai Sand Artists che si sono esibiti durante la sessione generale di oggi.

mercoledì 27 ottobre 2010

Viaggio nel tempo con il data warehouse

Non voglio certo alludere al jet-lag che senza dubbio si sta facendo sentire tra molti di quelli che, come me, sono venuti dall’Europa. Il viaggio nel tempo di cui sopra è riferito piuttosto all’eccezionale annuncio fatto oggi alla Teradata Partners conference, almeno dal mio punto di vista.

Come avevo anticipato ieri, le novità tecnologiche al media briefing di oggi sono state moltissime, ci tornerò su fra poco. Fermiamoci un attimo a pensare: ci siamo mai chiesti perché abbiamo preso una decisione che si è rivelata essere totalmente sbagliata?

Quando è capitato, sono sicuro che poi abbiamo provato a trovare una spiegazione: sicuramente non abbiamo prestato abbastanza attenzione ad alcuni elementi, o ci siamo fatti distrarre da altri, e poi ci siamo ripromessi di non commettere più quell'errore né alcun tipo di errore.Il Data Warehousing si occupa proprio del supporto decisionale; infatti a chi si chiede perché certe decisioni sono state prese in una certa maniera basterà riavvolgere i dati per avere una visuale più completa.

Finora non è stata una cosa molto semplice da fare per diversi motivi: i dati vengono modificati col tempo, alcuni vengono sovrascritti, e questo è il motivo per cui siamo abituati a scattare delle “istantanee” di tanto in tanto. Anche così però non è abbastanza per capire esattamente quando sono avvenuti certi cambiamenti e soprattutto che effetto questi hanno avuto sui dati.

Fino ad oggi la soluzione di tale problema avrebbe richiesto un’enorme quantità di lavoro manuale (con codici estremamente complessi): oggi questo compito è svolto interamente dal Teradata Database 13.10.

L’effetto di questa novità sarà molto simile a quello della soluzione geospaziale di qualche tempo fa: si è sempre fatto affidamento sui codici di avviamento postale per venire a capo del problema della individuazione geografica, ma da quando è stata introdotta la soluzione geospaziale tutte le applicazioni mobili l'hanno subito adottata. Scommetto che il pulsante di riavvolgimento temporale si troverà ovunque nei prossimi anni, e lo si potrà utilizzare per scoprire quali informazioni si possedevano realmente al momento di una certa decisione, o anche per renderlo evidente ad altri.

Grazie a questa soluzione si potrà rispondere molto più facilmente ed accuratamente a moltissime domande relative al business. Questa idea mi affascina moltisimo, forse perché mi fa venire in mente il film Ritorno al Futuro, che è uscito in Italia esattamente 25 anni prima di questo annuncio di Teradata. Se potessi tornare agli anni ’80, probabilmente ora starei ascoltando un vinile degli U2.

Mi chiedo se mi sentirei più come “Marty McFly” (Michael J. Fox) che non si rendeva pienamente conto di ciò che gli stava succedendo, oppure come “Doc”, sempre e completamente a suo agio.

Ma ora torniamo alla conferenza con le altre novità più interessanti:


- Teradata offre un Unified Logical Data Model che consente alle aziende di mappare tutte le loro value chains dall’inizio alla fine (e probabilmente superare le barriere di ogni singolo settore che prima erano trattate con specifici LDM)


- Una Platform family, che ora conta 5 componenti, che ha migliorato performance, storage e facilità di utilizzo


- Teradata Relationship Manager ha incorporato i moduli per coinvolgere i clienti su smartphone, iPad e siti di social media in pochi secondi - con tutte le conoscenze memorizzate nel data warehouse a portata di mano


- Il Portfolio Teradata Accelerated Analytics ora include nuovi tipi di dati, tecnologie emergenti, ottimizzazione dei partner, e strumenti per lo sviluppo di applicazioni.




Anche i nostri partner hanno presentato parecchie novità, ma oggi non sono in grado di parlarne: non avendo il dono dell’ubiquità non posso essere presente a tutte le sessioni parallele. Mi impegno però a parlarne il più presto possibile.

A presto!

martedì 26 ottobre 2010

Un'altra "Euphoric State Conference"

Sono appena arrivato in California, alla Teradata Partners Conference che quest'anno è a San Diego e, come mi succede ogni volta nella West Coast , mi ritrovo in una situazione a metà tra un terribile jet lag (la differenza con Milano e la maggior parte dell'Europa è di 9 ore) e un'eccitazione febbrile che mi spinge a ignorare la fatica e a gustarmi il fatto di essere qui.
Sabato, mentre arrivavo in aereo, mi sono ritrovato a canticchiare “it never rains in Southern California” mentre a San Diego pioveva, e mi sembrava addirittura che qualcuno annuisse silenziosamente.
C'è stato qualcuno mi sembra che riferendosi alla California l'ha chiamata “Euphoric State”...

L'unica vera calamità che affligge questo pezzo di terra (esclusi i terremoti occasionali) sembrano essere gli incendi che scoppiano di tanto in tanto. Nel 2007 ad esempio scoppiò un incendio nell'area vicina a Rancho Bernardo, dove si trovano sia il reparto Ricerca e Sviluppo di Teradata, sia il Global Support Center (GSC). Le autorità non vollero correre alcun rischio e ordinarono un'evacuazione che obbligò Teradata a chiudere temporaneamente le proprie strutture. Gli impianti non furono danneggiati e pochi giorni dopo la fine dell'incendio l'attività riprese come al solito.
Nel frattempo il GSC affrontava una sfida più complicata, dovendo assicurare la continuità dell'assistenza ai clienti Teradata ininterrottamente 24/7: il piano di business continuity funzionò splendidamente e l'assistenza ai clienti continuò senza problemi nonostante l'incendio. Quando ad esempio un retailer segnalò alcune "performance challenges" ad uno dei suoi nodi, Teradata Customer Services rispose prontamente risolvendo, come al solito, il problema in modo molto veloce. Il GSC si dimostrò dunque all'altezza della sfida.

La vicinanza della sede della conferenza di quest'anno al centro Teradata di Ricerca e Sviluppo è interessante perchè lunedì 25 ottobre Teradata e i suoi partners hanno annunciato moltissime novità importanti per il settore tecnologico.

Nei prossimi giorni cercherò di riportare gli highlights della conferenza, partendo dalla sessione generale di lunedì, in cui il nostro Chief Marketing Officer Darryl McDonald condividerà il suo concetto di socializzazione dei dati.

Per ora è tutto. Lo spettacolo va a incominciare!