Início do conteúdo
O que é Ciência de Dados?

O que é a Ciência de Dados

Ciência de dados é um processo, não um evento. Trata-se do processo de utilização de dados para entender coisas diferentes, para entender o mundo. É quando você tem um modelo ou hipótese de um problema, e tenta validar essa hipótese ou modelo com base em seus dados. Ciência de dados é a arte de descobrir as ideias e tendências que se escondem atrás dos dados. É quando você traduz dados em uma história. Então usa narrativas para gerar percepções. E com essas percepções, pode-se fazer escolhas estratégicas para uma empresa ou instituição.

Ciência de dados é um campo sobre processos e sistemas para extrair dados de várias formas, estruturados ou não, é o estudo dos dados propriamente dito. Como ciências biológicas é um estudo de biologia, Ciência física, é o estudo de reações físicas. Dados são reais, dados tem propriedades, e precisamos estudá-los, se vamos trabalhar neles. Ciência de dados envolve dados e alguns sinais.

A definição ou o nome surgiu nos anos 80 e 90, quando alguns professores analisavam o currículo de estatísticas, e pensaram que seria melhor chamá-lo de ciência de dados. Mas o que é ciência de dados? Vamos entender aqui a ciência de dados como uma tentativa de trabalhar com dados, para encontrar respostas a perguntas que estão sendo exploradas. Em poucas palavras, é mais sobre dados do que sobre ciência. Se você tiver os dados, e se você tiver curiosidade, e se você estiver trabalhando com os dados, e manipulando-os, explorando-os, esse exercício de analisar os dados, na tentativa de obter algumas respostas é ciência de dados.

Ciência de dados é relevante hoje porque temos toneladas de dados disponíveis, costumávamos nos preocupar com falta de dados, mas agora temos um dilúvio de dados. No passado, não tínhamos algoritmos, agora temos algoritmos próprios. No passado, os programas eram caros, Agora eles são abertos e gratuitos. No passado, nós não podíamos armazenar grandes quantidades de dados, Agora, por uma fração do custo nós podemos ter zilhões de conjuntos de dados por um custo muito baixo. Assim, as ferramentas para trabalhar com dados, a variabilidade dos dados, e a capacidade de armazenar e analisar dados, está muito em conta, está muito disponível, é universal, é o presente. Nunca houve um melhor momento para ser um cientista de dados.

 

Habilidades que um cientista de dados precisa ter

Na visão atual sobre ciência de dados, entendemos que o cientista de dados precisa ser curioso, extremamente argumentativo e julgador. Curiosidade é absolutamente obrigatório, se você não é curioso, não saberá o que fazer com os dados, julgador porque se você não possui noções preconcebidas sobre as coisas você não saberá por onde começar e argumentativo porque se você consegue argumentar e advogar sobre um caso, ao menos você consegue começar em algum lugar, aprender com os dados e então mudar suas suposições e hipóteses e seus dados irão ajudá-lo a aprender.

E você pode começar pelo ponto errado, você pode afirmar que acreditava nisso, mas agora com os dados eu sei isto e isto lhe concede um processo de aprendizado, então, curiosidade, ser capaz de tomar uma posição, uma posição firme e seguir em frente com ela. Outra coisa que um cientista de dados precisa é algum conforto e flexibilidade com plataformas para analytics: alguns programas algumas plataformas computacionais, mas isto é secundário. O mais importante é curiosidade e habilidade para tomar posições. Uma vez feito isso, uma vez que você analisou, então você obtêm algumas respostas.

Por fim, ser um bom historiador, esta é a habilidade final que um cientista de dados precisa ter, a habilidade de contar uma história. Uma vez que você possui o seu analytics, uma vez que tem suas tabulações, agora você é capaz de contar uma grande história a partir disso. Porque se você não for capaz de contar uma grande história disso, seus achados continuarão obscuros, continuarão ocultados, ninguém os conhecerá. Mas seu ganho de notoriedade está muito relacionado a sua habilidade de contar grandes histórias. Um ponto de partida seria observar qual a sua vantagem competitiva. Você deseja ser um cientista de dados em qualquer campo ou em algum especifico? Porque, vamos dizer que você deseja ser um cientista de dados e trabalha para uma empresa de TI ou uma baseada em web ou baseada em internet, então você precisa de um conjunto diferente de habilidades. E se você deseja ser um cientista de dados na área da saúde, você também precisa de um conjunto diferente de habilidades. Portanto, descubra primeiro qual a sua área de interesse, e qual a sua vantagem competitiva. Sua vantagem competitiva não será necessariamente suas habilidades em analytics. Sua vantagem competitiva será seu entendimento sobre alguns aspectos da vida onde você vai além dos outros em compreendê-los. Talvez seja um filme, talvez seja varejo, talvez seja saúde, talvez computadores. Uma vez que você descobriu onde está a sua expertise, então comece a adquirir habilidades em analytics. quais plataformas aprender e tais plataformas, estas ferramentas devem ser específicas para a industria que você se interessa. E quando tiver alguma proficiência nas ferramentas, o próximo passo seria aplicar suas habilidades a problemas reais, e então dizer para o resto do mundo o que você é capaz de fazer com isso.

Ciência de dados é um processo, não um evento. É o processo de utilização de dados para entender coisas diferentes, para entender o mundo. Para mim é quando você tem um modelo ou hipótese de um problema, e você tenta validar essa hipótese ou modelo com base em seus dados. Ciência de dados é a arte de descobrir as ideias e tendências que se escondem atrás dos dados. É quando você traduz dados em uma história. Então usa narrativas para gerar percepções. E com essas percepções, Você pode fazer escolhas estratégicas para uma empresa ou instituição. Ciência de dados é um campo sobre processos e sistemas para extrair dados de várias formas, estruturados ou não. Ciência de dados é o estudo dos dados. Como ciências biológicas é um estudo de biologia, Ciência física, é o estudo de reações físicas. Dados são reais, dados tem propriedades, e precisamos estudá-los, se vamos trabalhar neles. Ciência de dados envolve dados e alguns sinais. A definição ou o nome surgiu nos anos 80 e 90, quando alguns professores analisavam o currículo de estatísticas, e pensaram que seria melhor chamá-lo de ciência de dados. Mas o que é ciência de dados? Eu veria ciência de dados como uma tentativa de trabalhar com dados, para encontrar respostas a perguntas que estão sendo exploradas. Em poucas palavras, é mais sobre dados do que sobre ciência. Se você tiver os dados, e se você tiver curiosidade, e se você estiver trabalhando com os dados, e manipulando-os, explorando-os, esse exercício de analisar os dados, na tentativa de obter algumas respostas é ciência de dados. Ciência de dados é relevante hoje porque temos toneladas de dados disponíveis. Costumávamos nos preocupar com falta de dados. Agora temos um dilúvio de dados. No passado, não tínhamos algoritmos, agora temos algoritmos próprios. No passado, os programas eram caros, Agora eles são abertos e gratuitos. No passado, nós não podíamos armazenar grandes quantidades de dados, Agora, por uma fração do custo, Nós podemos ter zilhões de conjuntos de dados para um custo muito baixo. Assim, as ferramentas para trabalhar com dados, a variabilidade dos dados, e a capacidade de armazenar e analisar dados, está muito em conta, está muito disponível, é universal, é o presente. Nunca houve um melhor momento para ser um cientista de dados.