Chronon: plataforma de dados de código aberto para aplicações de IA/ML
Chronon é uma plataforma de recursos ponta a ponta de código aberto projetada para equipes de aprendizado de máquina (ML) construir, implantar, gerenciar e monitorar pipelines de dados para aprendizado de máquina.
O Chronon permite que você aproveite todos os dados da sua organização, incluindo tabelas em lote, fluxos de eventos e serviços, para conduzir seus projetos de IA/ML sem a necessidade de gerenciar a orquestração normalmente necessária.
Características principais:
- Consumir dados de diversas fontes, incluindo fluxos de eventos, instantâneos de tabelas de banco de dados, fluxos de dados alterados, terminais de serviço e tabelas de warehouse modeladas como dimensões, fatos ou tabelas de dimensões que mudam lentamente.
- Produza resultados em contextos online e offline. Online, como endpoints escalonáveis de baixa latência para veiculação de recursos, ou offline, como tabelas Hive para gerar dados de treinamento.
- Precisão em tempo real ou em lote: configure os resultados para serem precisos em Temporal ou Instantâneo. A precisão temporal atualiza valores de recursos em tempo real em contextos on-line e produz recursos off-line corretos em um momento específico. A precisão do instantâneo atualiza os recursos uma vez por dia à meia-noite.
- Preencha conjuntos de treinamento a partir de dados brutos sem esperar meses para acumular logs de recursos para treinamento de modelo.
- Utilize uma API Python poderosa: tipos de fontes de dados, atualização e contextos são abstrações em nível de API compostas de primitivos SQL intuitivos, como group-by, join e select, com aprimoramentos poderosos.
- Automatize o monitoramento de recursos: gere automaticamente pipelines de monitoramento para entender a qualidade dos dados de treinamento, medir a distorção no fornecimento de treinamento e monitorar o desvio de recursos.
Chronon está disponível gratuitamente no GitHub .