Impacto, aplicações e desenvolvimento profissional
Kapitalo Investimentos
Minha experiência é com aplicação de métodos quantitativos e de ciência de dados em pesquisa macroeconômica.
Dados disponíveis em tempo (quase) real.
Em maior granularidade.
Porém, geralmente bagunçados!
Mas com algumas habilidades podemos extrair valor (veremos mais adiante).
Período COVID impulsionou a adoção destas fontes.
Adoção de métodos como Random Forest, LASSO, XGBoost, etc.
Vantagens: seleção de variáveis, forma funcional flexível, não-linearidade e maior acurácia.
Ideal para grande conjunto de dados.
Softwares tradicionais (closed-source) demoram a incorporar estes métodos.
Novos métodos são desenvolvidos em open-source – Python e/ou R, geralmente (mais sobre isso adiante).
Amostra de > 5.000 artigos na literatura de economia e finanças entre 1990 e 2021 contendo palavras selecionadas.
Fonte: Warin & Stojkov, 2021. Journal of Financial Risk Management
Fonte: https://r4ds.had.co.nz/introduction.html
Uma série de copia e cola.
Capacidade de escalar mais limitada.
Problemas de reprodução são recorrentes.
Ferramentas open-source evoluem constantemente.
Menor intervenção manual nos processos.
Ambientes integrados criam comunicação direta e eficiente entre as tarefas.
Melhor gerenciamento de erros e debugging.
Permite Template task e reutilização de código.
Sem custo com aquisição de softwares.
Na prática: mais barato, menos erro operacional, aumento da cobertura de análise e velocidade.
LLM’s adicionam um novo eixo, em especial no processamento de dados não-estruturados e como assistente para o desenvolvimento de código.
Melhores métodos para projeção e maior conjunto de dados disponível: aumento da acurácia.
Automatização: relatórios, projeções, revisões de cenário.
Escala: maior cobertura de países e granularidade dos indicadores.
Melhor comunicação das análises para quem consome.
Dados alternativos são mais eficazes como “avisos” em tempo real da direção da variável de interesse.
Tendem a performar melhor em períodos de alta volatilidade (Ex: COVID, recessões, etc).
O melhor uso é quando combinados com indicadores tradicionais.
Uma boa dose de tratamento e modelagem é fundamental para extrair sinal desses dados.
Economia e finanças.
Estatística: descritiva e inferência.
Ajuste sazonal, deflacionar valores, filtros, etc.
Econometria (OLS, VAR, ARIMA).
Engenheiros, Estatísticos, CS, etc.
Programação (Python/R).
Banco de dados relacional (SQL e afins).
Machine Learning.
Noções de DevOps: colocar projetos em produção.
Lista em crescimento: LLMs?
Fonte: LinkedIn
Maior rigidez nos cursos de graduação, mestrado e doutorado.
Busca por profissionais não é fácil.
Risco de overfit educacional.
Possíveis saídas:
COPPEAD/UFRJ - 26 de Setembro de 2024. Slides disponíveis em: http://coppead2024.rleripio.com. Built with Quarto.