Professional Documents
Culture Documents
DADOS E APRENDIZADO
D E M Q U I N A PA R A C I O
CONTEDO
Introduo 03
Concluso 26
Referncias 27
Introduo | | 22
Contedo
INTRODUO
Hoje, os dados esto por toda parte. Eles so transmitidos a velocidades vertiginosas,
em diversos formatos, a partir de dispositivos de bilhes de usurios conectados.
Geralmente, usar o Big Data considerado uma oportunidade, mas apenas para
empresas que tenham estrutura para lidar com o volume e a diversidade dele. Para
as outras empresas, a avalanche de dados pode trazer o risco de que insights em
potencial permaneam inexplorados, necessidades de clientes no sejam atendidas
eempresas continuem tomando decises sem em+basamento.
Introduo | 3
I N T E R A E S P O R P E S S O A C O N E C TA D A P O R D I A
5.000
4.800
Nmero de interaes/pessoa/dia
3.000
1.000
601
218
At 2025, uma pessoa comum conectada usar dispositivos conectados aproximadamente 4.800 vezes por dia, oequivalente a uma
interao a cada 18 segundos.2
NOSSAS RAZES
O Guia sobre anlise de dados e aprendizado de mquina do Google Cloud baseia-se nos 20 anos em que
o Google enfrentou alguns dos problemas mais complexos do setor relacionados a dados. Ao longo do
percurso, contribumos com pesquisas inditas que ajudaram a moldar ocenrio do Big Data: dos dois
artigos acadmicos do final de 2003 e 2004, que juntos geraram o movimento do Hadoop, ao artigo
sobre o Dremel, que constitui a base dos recursos de data warehouse na nuvem presentes neste guia.
Introduo | 4
CAPTULO 1
O N O V O C E N R I O PA R A O S D A D O S
01
O N O V O C E N R I O PA R A O S D A D O S 01
Seria mais fcil gerenciar os dados se o crescimento fosse limitado a poucas fontes ouse
os dados fossem uniformes. O desafio consiste na diversidade de fontes e formatos. Isso
inclui o volume crescente de dados no estruturados: e-mails, registros de sistema, pginas
da Web, transcries de clientes, documentos, apresentaes, bate-papos informais e um
extraordinrio volume de rich media, como imagens evdeos em alta definio. Volumes enormes
de informao tornam-se disponveis instantaneamente em qualquer dispositivo conectado
Internet, o que gera novas expectativas em torno da disponibilidade e da prontido dos dados.
Este guia analisa como os servios gerenciados em nuvem ajudam empresas novas e j
estabelecidas a enfrentar os desafios do processamento de dados. Ele detalha um caminho que
comea com a captura de dados brutos da empresa no armazenamento em nuvem. Conforme
as questes empresariais forem surgindo, as ferramentas com base na nuvem podem preparar
eestruturar os dados brutos quando necessrio. Em seguida, os dados preparados so incorporados
S E M S E R V I D O R : O C A M I N H O PA R A A P R O D U T I V I D A D E E M T I
As arquiteturas modernas sem servidor so o pice de uma srie de esforos para reduzir a extenso da
rea que os desenvolvedores e as equipes de TI precisam gerenciar. A meta da computao sem servidor
, essencialmente, eliminar a mercantilizao do trabalho (do gerenciamento de clusters de servidores,
fragmentao de bancos de dados, balanceamento de carga, planejamento de recursos, garantia de
disponibilidade) para que as equipes de TI possam se concentrar naquilo que mais importante para
onegcio. A funo sem servidor estabelece uma ntida distino entre a TI mercantilizada(o servio
cotidiano de manuteno que parece praticamente o mesmo em cada empresa) e o servio diferenciado
queeleva a TI para a posio de fornecedor direto de valor comercial.
CAPTULO 1 RESUMO
FIS SETOR
Servios financeiros
A FIS faz anlises de eventos e inovaes do mercado com
servios de nuvem totalmente gerenciados
SOBRE
LEIA MAIS
ARMAZENAMENTO EM NUVEM
E D ATA W A R E H O U S I N G
02
A R M A Z E N A M E N T O E M N U V E M E D ATA W A R E H O U S I N G
Os silos de dados distribudos por toda a empresa continuam a aborrecer tanto a equipe de
TI quanto a comercial, com novos silos (por razes tcnicas, corporativas ou ambas) criados
diariamente.5 A revista Harvard Business Review fez uma publicao sobre anecessidade
da fonte nica da verdade para dados, assim como as diversas lentes pelas quais diferentes
ramos de negcios podem analisar os dados.6
A IDC estima que menos de 1% de todos os arquivos sejam analisados.7 Os outros 99%,
dependendo das necessidades do negcio no momento, contm informaes sobre
insightsvoltados tomada de deciso. Como as organizaes no conseguem prever
asquestes empresariais que podero surgir, elas precisam de maneiras simples, baratas
eflexveis de armazenar um grande volume de dados. Isso vale principalmente para dados
noestruturados, que constituem a maioria dos dados gerados.8
<1%
Alm de gerar economia de custos, o armazenamento em nuvem funciona como a base de anlises robustas.
Asempresas podem capturar arquivos estruturados e no estruturados nos formatos originais com facilidade.
Como o armazenamento separado intencionalmente do processamento e da anlise, as equipes podem
postergar a estruturao dos dados brutos para anlise somente quando questes empresariais surgirem. O mais
importante de tudo que dados brutos que tenham a mesma origem podem ser facilmente reestruturados para
responder a novas questes de imediato. O que diferencia o armazenamento em nuvem a eficincia dessas
etapas de captura e reutilizao dos dados. Para preparar uma organizao para que ela se beneficie das anlises,
as equipes precisam garantir que os dados brutos dos processos empresariais sejam capturados e centralizados.
Essa flexibilidade est acelerando a adoo da nuvem como repositrio para dados no estruturados das
organizaes. Cerca de metade das organizaes nos EUA, Europa e sia-Pacfico antecipam saltos de pelo
menos 5% no armazenamento de dados no estruturados na nuvem no ano seguinte, sendo que muitas delas
informam um aumento superior a 10%.10
De acordo com uma pesquisa com mais de 500 lderes mundiais em TI conduzida pela MIT Sloan Management Review
em nome do Google Cloud, a adeso nuvem permanece em crescimento, e a expectativa de que a maioria (65%) dos
aplicativos, dados e/ou infraestrutura seja baseada em nuvem at 2019.
A Internet das coisas um importante fator de crescimento dessa migrao para a nuvem, sendo que 91% dos
entrevistados com iniciativas de IoT esto atualmente implantando (59%) ou planejam implantar (32%) dados
de dispositivos conectados IoT na nuvem. Os entrevistados mencionaram a capacidade de incorporar novas
ferramentase plataformas (33%), maior velocidade da implantao e iterao de app (31%), maior flexibilidade nos
processos empresariais e nas escolhas de fornecedores (29%) e maior segurana (28%) como os principais motivos
para implantar dados da IoT na nuvem.
Para usar os dados da IoT de maneira eficiente, as empresas precisam compreend-los dentro do contexto.
Umdatawarehouse na nuvem que permite entradas de lote e dados de streaming, em conjunto com uma
plataformade anlise robusta, ajuda a assegurar que seus dados de IoT gerem insights em tempo real.
Ao capturar dados de qualquer tipo de maneira econmica, as organizaes podem voltar a ateno
para possibilitar uma perspectiva organizada dos processos empresariais mais importantes. Embora
o armazenamento em nuvem centralize dados no formato bruto nativo, um data warehouse na
nuvem permite que empresas renam dados de silos diferentes para anlise, assim como um data
warehouse tradicional faria. Com a nuvem, as empresas podem gerenciar um grande volume de dados
com investimento mnimo de capital, escala praticamente ilimitada e pagamento por utilizao. Os
servios gerenciados em nuvem vo mais alm, aliviando as preocupaes de TI sobre a infraestrutura
subjacente. As empresas precisam definir quais questes empresariais devem ser respondidas e quais
so os dados necessrios para respond-las.
Por exemplo:
Quais so as principais metas empresariais dos meus dados? Entender como os usurios
interagem com os meus sistemas, identificar tendncias, aumentar as vendas, construir
afidelidadedo consumidor ou algo diferente?
Qual ser a origem dos meus dados mais importantes (transaes, registros de servidores,
servios em nuvem, dispositivos/Internet das coisas, mdia social)? Eles j foram importados
para o armazenamento em nuvem?
Com que velocidade o meu sistema precisa incorporar novos dados em relatrios e visualizaes?
Existe uma cultura que incentive a tomada de deciso baseada em dados em toda a
organizao(no apenas entre os analistas de TI e os cientistas de dados)? Quem deveria
teracesso plataforma de anlise?
Armazenamento em nuvem
Os dados do armazenamento em nuvem podem ser importados para um data warehouse na
nuvem para anlise.12 Nessa etapa, possvel formalizar um esquema com base nas questes
empresariais que precisam de resposta, propiciando a estruturao dos dados brutos para anlise.
Dados de streaming
Dados de aplicativos da Web, de dispositivos mveis e da Internet das coisas (IoT, na sigla
emingls) podem ignorar o armazenamento em nuvem e serem transmitidos diretamente
para um data warehouse na nuvem (veja no captulo 3: Integrao de dados em tempo real).
Administrao de dados
Com o acesso baseado em funes, qualquer pessoa ou desenvolvedor de aplicativos pode consultar
dados armazenados em um data warehouse na nuvem, gerar relatrios ou acessar visualizaes.
O data warehousing na nuvem aceita o gerenciamento de acesso individualizado voltado para
oque a pessoa precisa saber. A auditabilidade total e o controle do acesso personalizadoajudam
a democratizar a cincia de dados, ao mesmo tempo em que mantm salvaguardas de segurana.
De fato, mais da metade das empresas nos EUA, Europa e sia-Pacfico relatam que esto
implementando, j implementaram ou esto expandindo o uso de ferramentas de inteligncia
empresarial operadas pela prpria empresa e utilizadas nela.14
Antes, a responsabilidade por concluses estatisticamente precisas com base em dados era exclusiva aos
cientistas de dados profissionais. Porm, em 2018, de acordo com a McKinsey, Os EUA podero enfrentar
uma escassez de 140.000 a 190.000 pessoas com conhecimento aprofundado em anlise de dados, assim
como 1,5 milho de gerentes e analistas com o conhecimento para usar as anlises de Big Data para tomar
decises efetivas.15
Com a intensificao da competio, a maioria das empresas precisar de uma estratgia diferente
voltada para os talentos. Os cientistas de dados amadores que, conforme definio do InformationWeek,
so pessoas que fazem anlises de dados, mas cujas principais atribuies no esto relacionadas
estatstica ou anlise, podem ser um complemento significativo para cientistas de dados internos,
principalmente para empresas que investem no desenvolvimento da cultura da cincia de dados.16
Para ter sucesso, quem pretende se tornar cientista de dados amador precisa:
CAPTULO 2 RESUMO
2 Um data warehouse na nuvem permite que as organizaes renam dados de silos distintos para
anlise, abrangendo desde armazenamento em nuvem, bancos de dados transacionais e analticos
no local ou na nuvem ou dados armazenados com outros servios em nuvem. As organizaes podem
executar consultas, gerar relatrios e criar visualizaes sem gerenciar a infraestrutura subjacente.
CENTRO COLORADO DE
SETOR
MEDICINAPERSONALIZADA
Assistncia mdica
O Centro Colorado de Medicina Personalizada (CCPM) est conduzindo
uma pesquisa de ponta por meio da anlise do DNA de pacientes para prever
SOBRE
o risco de doenas e desenvolver tratamentos direcionados com base na
gentica do indivduo. O CCPM depende do Health Data Compass, o data O Centro Colorado de Medicina
Personalizada (CCPM, na sigla
warehouse de empresas na rea da sade do CCPM. O Health Data Compass
em ingls) uma parceria entre
integra os dados genmicos dos pacientes do CCPM e registros eletrnicos
a University of Colorado Denver,
de sade da UCHealth, do Childrens Hospital Colorado e do CU Medicine,
a UCHealth, o Childrens Hospital
incluindo registros externos como reivindicaes de seguros, registros
Colorado e o CU Medicine e
de sade pblica e dados ambientais.
situa-se em Denver, na regio
doColorado.
Antes, o Health Data Compass usava um sistema tradicional no local para
armazenar e analisar dados. Mas essa abordagem revelou-se onerosa de
ser mantida, no atendia s necessidades de anlise existentes do centro
e no atingia o crescimento previsto. Aps um projeto piloto abrangente
de seis meses, o Health Data Compass migrou para o GCP e o Tableau,
que juntos so capazes de processar imensos conjuntos de dados e fazer
anlises robustas de dados visuais, alm de serem mais baratos e facilitarem
a escalonabilidade de acordo com o crescimento do CCPM. A capacidade
de o GCP, incluindo BigQuery (o data warehouse do Google Cloud) de aceitar
a compliance com a HIPAA de acordo com os requisitos do CCPM foi um
fator importante para essa deciso.
LEIA MAIS
INTEGRAO DE DADOS
EMTEMPO REAL
03
INTEGRAO DE DADOS EM TEMPO REAL 03
90%
e integrao de dados em larga escala. Imagine um termostato
inteligenteque procura aprender e se ajustar s preferncias
de diferentes equipes em um edifcio comercial. Enquanto o
termostato estem uso, a nuvem consome dados de uso brutos,
como as configuraes de temperatura e os nveis de consumo de
energia aolongo do dia. Conforme os dados chegam, um canal de
das empresas
processamento pode ser ativado, quando necessrio, na preparao
TM INTERESSE EM
dos dados brutos. Assim, possvel garantir que as entradas estejam
I M P L A N T A R A P R E PA R A O D E
em um intervalo vlido, converter a temperatura e a energia usadas D A D O S D E A U T O AT E N D I M E N T O
nas unidades pretendidas e formatar os dados temporais. O canal de P A R A A P O I A R I N I C I A T I VA S
dados os estrutura formalmente e, em seguida, carrega os resultados R E L A C I O N A D A S A O B I G D ATA . 20
Enquanto os sistemas tradicionais concentram-se na anlise de dados off-line em lotes, a demanda por insights
em tempo real pede uma nova abordagem. Os sistemas de anlise de streaming com base em nuvem so
desenvolvidos para processar o fluxo de dados de aplicativos da Web, smartphones ou milhes de sensores da
IoT em tempo real. Centenas de milhares de sensores podem ser instalados em equipamentos de campo para
informar continuamente o status bruto nuvem para processamento e monitoramento. Feeds de recursos visuais
podem ser analisados em tempo real para aplicativos como de deteco de anomalias e reconhecimento facial/de
objetos. Os servios em nuvem amplamente testados e implantados podem ser aproveitados para casos de uso
como esses. Assim, a anlise de dados de streaming pode ser implementada em questo de dias.
Com a anlise de dados de streaming em tempo real, os dados vo diretamente para canais
de processamento. Os dados transformados podem ser integrados em um data warehouse
na nuvem, possibilitando consultas, visualizaes e gerao de relatrios em segundos.
Desta forma, o canal de processamento funciona como um tipo de middleware que pode ser
ativado quando necessrio, capaz de reunir o streaming de dados em tempo real com dados
em lote retirados do armazenamento. Os dados podem ser estruturados com flexibilidade
para responder s questes empresariais de uma organizao conforme elas surjam.
C O M O A P R O V E I TA R A O M X I M O S E U S I N V E S T I M E N T O S N O B I G D ATA
Muitas empresas inovadoras j usam o Big Data, geralmente com base em ferramentas de cdigo aberto como a
Apache Hadoop (em ingls) e a Apache Spark (em ingls). Para esses negcios, possvel proteger os investimentos
existentes em talentos e ferramentas e, ao mesmo tempo, aproveitar as vantagens da produtividade da nuvem.
As ferramentas de cdigo aberto para Big Data esto amplamente disseminadas e continuam crescendo.
Mundialmente, muitas empresas esto armazenando um volume cada vez maior de dados no estruturados em
sistemas de arquivo de nuvem pblica, inclusive no Hadoop. Mais de um tero dos entrevistados nos EUA e na
Europae mais do que a metade na regio sia-Pacfico relatam que esto implementando, j implementaram
ou esto expandindo a implementao do Hadoop, incluindo HBASE, Accumulo, MapR, Cloudera e Hortonworks.
Domesmo modo, cerca de um tero dos entrevistados nos EUA e na Europa e impressionantes 60% na regio
sia-Pacfico esto implementando, j implementaram ou esto expandindo a implementao de plataformas
dedados em memria, incluindo Apache Spark, SAP Hana, Kognitio, Terracotta e Gigaspaces.
Continuar a gerenciar projetos do Big Data usando ferramentas de cdigo aberto conhecidas, mas migrar
para as mquinas virtuais na nuvem. As vantagens normais da nuvem incluem: inutilizao do oneroso
CapEx, migrao para um modelo de faturamento OpEx, no qual as organizaes pagam de acordo
com os dados armazenados e processados, e facilidade na escalabilidade. Observe que, nesse modelo,
os desenvolvedores e as equipes de TI ainda precisam gerenciar os prprios canais de processamento
de dados e armazenamento. No entanto, esse o caminho mais simples para aproveitar os ativos j
estabelecidos nas empresas, como talentos, ferramentas e relacionamentos com fornecedores.
A nuvem oferece verses totalmente gerenciadas de muitas das ferramentas de cdigo aberto mais
conhecidas no Big Data. Por exemplo, executar Apache Hadoop, Apache Spark, Apache Pig e Apache
Hive na nuvem descarrega tarefas bsicas de gerenciamento de dados como implantao, registro
emonitoramento.21 Esta opo excelente para equipes que querem aproveitar os cenrios fsicos
nolocal e nativos na nuvem.
Qualquer uma das opes permite que as organizaes protejam os investimentos na implantao do
Big Data, mas usam a economia da nuvem de maneira inteligente para controlar custos e ter flexibilidade.
CAPTULO 3 RESUMO
3 A anlise de streaming na nuvem permite que dados da Web, de dispositivos mveis e de aplicativos da
IoTfaam streaming para canais de processamento de dados em tempo real. A partir daqui, os dados
podem ser preparados e integrados em um data warehouse na nuvem para gerar insights sobre o negcio
em tempo real.
CITIBANK UK
SETOR
Servios financeiros
Nesta prova de conceito, a tarefa da equipe era mostrar como seria
fcil para o Citibank usar o Google BigQuery e o Google Cloud Pub/Sub
para analisar e consumir o equivalente a 1.000 instrumentos SOBRE
LEIA MAIS
APRENDIZADO DE MQUINA
EINTELIGNCIA ARTIFICIAL
04
APRENDIZADO DE MQUINA E INTELIGNCIA ARTIFICIAL
04
Inovaes recentes sobre o aprendizado de mquina (ML, na sigla em ingls)
e inteligncia artificial (IA) frequentemente ganham destaque no noticirio.
Computadores derrotaram campees mundiais humanos (em ingls) no
Go, um jogo de tabuleiro com mais movimentos do que a quantidade de
tomos no universo.22 Eles superaram videogames famosos (em ingls) e,
sobretudo, aprenderam a reconhecer gatos (em ingls).23 Mais recentemente,
uma iniciativa de IA foi capaz de gerar uma economia gigantesca dos custos
com energia (em ingls), destacando o aprendizado de mquina como uma
estrutura com o propsito geral de compreender dinmicas complexas.24
Essa estrutura est comeando a encontrar vrias aplicaes e a gerar
resultados em diversos setores.
60%
dados do mundo real. A centralizao do armazenamento e da preparao
dedados na nuvem (as metas dos captulos 2 e 3, respectivamente) cria
a base ideal para o treinamento e aperfeioamento dos modelos de IA.
quando e por que um comprador especfico decidir fazer uma determinada DELES DEPENDE DA
que o varejista selecione o produto certo para uma determinada pessoa no BEM-SUCEDIDA
momento certo. Este nvel de personalizao, antes atingido por pequenos DOAPRENDIZADO
M O D E L O S P R - T R E I N A D O S : O P R I M E I R O PA S S O E M D I R E O I A
A forma mais simples de comear a usar a IA aplicando modelos de aprendizado de mquina pr-treinados, disponveis
instantaneamente por meio da nuvem. No necessrio conhecimento prvio sobre ML. Esses recursos podem ser conhecidos
porquem usa aplicativos de consumidores famosos, nos quais alguns dos modelos atingiram nveis de preciso preditiva
que excedem a capacidade humana:
ANLISE DE IMAGENS
ANLISE DE VDEOS
Esses servios so gerais (no vinculados a aplicativos de consumidores) e podem ser facilmente incorporados a qualquer aplicativo
por meio de simples chamadas de API. Os desenvolvedores no precisam conhecer os detalhes estruturais. Sem ter que desenvolver
nenhum desses servios internamente, as empresas podem explorar os recursos mais recentes instantaneamente, como um servio.
vez de ajustar os servios pr-configurados, as empresas bem estabelecidas sobre as principais vantagens
provenientes dos projetos. Os
podem usar dados prprios para otimizar os processos empresariais para
principais benefcios citados foram
os clientes delas, o que constitui uma poderosa fonte de diferenciao.
os seguintes:
Os casos de uso abrangem muitos setores e revelam algumas das economia de tempo
aplicaes mais promissoras de IA. A deteco de fraudes nos servios reduo dos custos
melhor gerenciamento de risco
financeiros eamanuteno preventiva na indstria destacam a capacidade
melhor qualidade das anlises
de identificar anomalias em um turbilho de transaes e registros confusos,
aumento de receita
uma necessidade comum a muitos setores. As sugestes de diagnstico
etratamento em assistncia mdica e as avaliaes da fiabilidade creditcia Outros citaram a automatizao,
a melhoria do servio e a melhoria
destacam a capacidade do aprendizado de mquina em auxiliar com
do planejamento de inventrio. 27
a categorizao, algo til de forma geral.
Os recursos apresentados nos captulos 2 e 3 funcionam como uma base para treinar os modelos de
aprendizado de mquina usando dados prprios. Com os dados brutos j centralizados no armazenamento
em nuvem e em um data warehouse na nuvem, os canais de dados sem servidor podem extrair esses dados
continuamente e prepar-los para treinar modelos de ML personalizados. J que os modelos de ML podem ser
hospedados na nuvem, eles se tornam imediatamente disponveis para fazer predies para aplicativos. Esse
circuito forma um ciclo virtuoso, no qual os modelos de ML hospedados na nuvem continuam se aperfeioando
a partir dos novos dados de treinamento, que, por sua vez, mantm os modelos atualizados e relevantes.
P R I N C I PA I S N E C E S S I D A D E S MELHORIA DA
E M P R E S A R I A I S R E L ATA D A S A N L I S E P R E D I T I VA
P R I N C I PA I S C A S O S D E U S O D E
em:28 APRENDIZADO DE MQUINA
no varejo
ASSISTNCIA MDICA
avaliao do risco de crdito
SERVIOS FINANCEIROS REDUO DA
INDSTRIA C Ode
previso da demanda de produtos para melhorar a cadeia N fornecimento
FIANA NA
INTERVENO
VA R E J O reposio de materiais
AUMENTO DA MANUAL
MDIA/JOGOS A U T O M AT I Z A O
A era do aprendizado de mquina finalmente chegou e j est a todo vapor nas empresas pequenas que investem
emtecnologia, de acordo com uma nova pesquisa com lderes empresariais e de tecnologia do MIT Technology
Review Custom. Algumas das principais descobertas:29
50%
dos responsveis pela implementao
> de ML em fase inicial j notaram um ROI.
45%
tiveram anlises de dados
einsights mais abrangentes.
CAPTULO 4 RESUMO
2 A IA baseia-se em um grande volume de dados de treinamento, que oferece empresas bem estabelecidas
a vantagem exclusiva de fazer extraes do imenso volume de dados da empresa gerados durante o longo
histrico de operaes.
3 Armazenamento em nuvem, data warehousing, integrao de dados e anlise fornecem uma base natural
para a IA e o ML ao tornar os dados disponveis para treinamento e otimizao em tempo real, o que
alimenta um ciclo virtuoso de melhoria contnua.
S A I B A M A I S S O B R E O Q U E O G O O G L E C L O U D P O D E FA Z E R P E L O S E U N E G C I O.
Concluso | 26
REFERNCIAS
1. 81% dos executivos seniores entrevistados pela Ernst & Young concordaram que os dados devem estar no centro da
tomada de deciso, somente 31% precisaram reestruturar as operaes de maneira significativa para incorporar o Big
Data e apenas 23% haviam implementado estratgias de dados em toda a organizao. Ernst & Young, Becoming an
Analytics-Driven Organization (2015) (link).
2. David Reinsel et al., Data Age 2025: The Evolution of Data to Life-Critical (IDC, 2017) (link).
3. Cade Metz, Exclusive: Inside Google Spanner, the Largest Single Database on Earth, Wired
(26 de novembro de 2012) (link).
Cade Metz, Spanner, the Google Database that Measured Time, Is Now Open to Everyone, Wired
(14 de fevereiro de 2017) (link).
4. Robert McMillan, Inside the Artificial Brain thats Remaking the Google Empire, Wired (16 de julho de 2014) (link).
TensorFlow (link).
5. Forrester, Forresters Global Business Technographics Data and Analytics Survey (2016) (link).
6. Leandro DalleMule and Thomas H. Davenport, Whats Your Data Strategy? Harvard Business Review
(maio de 2017) (link).
7. John Gantz and David Reinsel, The Digital Universe in 2020: Big Data, Bigger Digital Shadows, and Biggest Growth in the Far
East (IDC, 2012) (link).
8. Tracie Kambies et al., Tech Trends 2017: Dark Analytics: Illuminating Opportunities Hidden within Unstructured Data
(Deloitte University Press, 2017) (link).
10. Forrester, Forresters Global Business Technographics Data and Analytics Survey (2016) (link).
11. Three Ways Marketing Organizations Can Make Data More Actionable, Harvard Business Review
(9 de agosto de 2016) (link).
12. Modernos data warehouses na nuvem auxiliam a importao (e at consultas especficas) de muitos formatos
semiestruturados automaticamente. Para saber mais sobre dados no estruturados que precisam ser transformados
primeiro (ex: ETL), veja o captulo 3: preparao de dados.
13. Forrester, Forresters Global Business Technographics Data and Analytics Survey (2016) (link).
14. Forrester, Forresters Global Business Technographics Data and Analytics Survey (2016) (link).
15. James Manyika et al., Big Data: The Next Frontier for Innovation, Competition, and Productivity (McKinsey Global Institute,
2011) (link).
16. Lisa Morgan, Citizen Data Scientists: 7 Ways to Harness Talent, InformationWeek (24 de julho de 2015) (link).
17. Centro Colorado de Medicina Personalizada: Improving Healthcare by Integrating Patient Records and Genetic Data Using
Google Cloud Platform and Tableau (Google Cloud Platform, 2017) (link).
18. Steve Lohr, For Big-Data Scientists, Janitor Work Is Key Hurdle to Insights, New York Times (17 de agosto de 2014) (link).
19. Forrester, Forresters Global Business Technographics Data and Analytics Survey (2016) (link).
20. Forrester, Forresters Global Business Technographics Data and Analytics Survey (2016) (link).
Referncias | 27
22. Paul Mozur, Googles A.I. Program Rattles Chinese Go-Master As It Wins Match, New York Times
(25 de maio de 2017) (link).
23. Nicola Twilley, Artificial Intelligence Goes to the Arcade, The New Yorker (25 de fevereiro de 2015) (link).
John Markoff, How Many Computers to Identify A Cat? 16,000, The New Yorker (25 de junho de 2012) (link).
24. James Vincent, Google Uses DeepMind AI to Cut Data Center Energy Bills, The Verge (21 de julho de 2016) (link).
25. Harvard Business Review Analytic Services Global Data and Analytics Survey, sponsored by Google (2017).
26. Uma pesquisa do MIT Technology Review mostrou pequenas empresas na fase inicial da adoo do aprendizado
de mquina e descobriu que: 60% de um grupo de 375 entrevistados, no qual cerca de dois teros eram empresas
com menos de 1.000 funcionrios, foram amplamente influenciados pelos setores de tecnologia, negcios e servios
financeiros. MIT Technology Review Custom and Google Cloud, Machine Learning: The New Proving Ground for
Competitive Advantage (2017) (link).
27. Anna Rader, Machine Learning Initiatives Across Industries: Practical Lessons from IT Executives (M-Brain, sponsored
byGoogle, 2017) (link).
28. Anna Rader and Irida Jano, Machine Learning Market Research: How Leading Industries Are Adopting AI
(M-Brain 2017)(link).
29. MIT Technology Review Custom and Google Cloud, Machine Learning: The New Proving Ground for Competitive
Advantage (2017) (link).
Concluso | 28
2017 Google Inc.
1600 Amphitheatre Parkway, Mountain View, CA 94043