Chronon: plataforma de dados de código aberto para aplicações de IA/ML

Chronon é uma plataforma de recursos ponta a ponta de código aberto projetada para equipes de aprendizado de máquina (ML) construir, implantar, gerenciar e monitorar pipelines de dados para aprendizado de máquina.

Cronon

O Chronon permite que você aproveite todos os dados da sua organização, incluindo tabelas em lote, fluxos de eventos e serviços, para conduzir seus projetos de IA/ML sem a necessidade de gerenciar a orquestração normalmente necessária.

Características principais:

  • Consumir dados de diversas fontes, incluindo fluxos de eventos, instantâneos de tabelas de banco de dados, fluxos de dados alterados, terminais de serviço e tabelas de warehouse modeladas como dimensões, fatos ou tabelas de dimensões que mudam lentamente.
  • Produza resultados em contextos online e offline. Online, como endpoints escalonáveis ​​de baixa latência para veiculação de recursos, ou offline, como tabelas Hive para gerar dados de treinamento.
  • Precisão em tempo real ou em lote: configure os resultados para serem precisos em Temporal ou Instantâneo. A precisão temporal atualiza valores de recursos em tempo real em contextos on-line e produz recursos off-line corretos em um momento específico. A precisão do instantâneo atualiza os recursos uma vez por dia à meia-noite.
  • Preencha conjuntos de treinamento a partir de dados brutos sem esperar meses para acumular logs de recursos para treinamento de modelo.
  • Utilize uma API Python poderosa: tipos de fontes de dados, atualização e contextos são abstrações em nível de API compostas de primitivos SQL intuitivos, como group-by, join e select, com aprimoramentos poderosos.
  • Automatize o monitoramento de recursos: gere automaticamente pipelines de monitoramento para entender a qualidade dos dados de treinamento, medir a distorção no fornecimento de treinamento e monitorar o desvio de recursos.

Chronon está disponível gratuitamente no GitHub .