A atividade "Modelo de trem para prever valores" pode ser encontrada em "Aprendizagem de máquinas". Predizer" no espaço de trabalho "Atividade".
A atividade cria um novo modelo de aprendizagem de máquinas para a previsão de valor, treina-a com base nos dados de entrada e salva o modelo final em um arquivo.
Algoritmos para treinamento de um modelo em uma atividade de aprendizagem de máquinas para previsão de valor podem ser divididos em duas classes: algoritmos lineares e algoritmos de árvore de decisão.
Os algoritmos lineares criam um modelo que calcula uma saída com base em uma combinação linear de dados de entrada e um conjunto de pesos. Os pesos são parâmetros do modelo que são calculados durante o treinamento. Estes algoritmos funcionam bem com dados cujo valor previsto depende linearmente de suas propriedades.
Os algoritmos lineares são escaláveis e rápidos, e sua velocidade depende do número de propriedades (colunas das quais se deriva a saída) e da quantidade de dados a serem treinados.
Os algoritmos de árvore de decisão criam um modelo contendo um conjunto de soluções com base nos dados de treinamento. Algoritmos desta classe não exigem dependência linear da saída das propriedades ou normalização das propriedades.
Os algoritmos de árvore de decisão geralmente fornecem resultados mais precisos do que os algoritmos lineares, mas requerem mais recursos e não são tão escaláveis.
Os algoritmos lineares incluem LbfgsPoissonRegression e OnlineGradientDescent, enquanto os algoritmos de árvore de decisão incluem FastTree e FastForest.
Ao criar o modelo de aprendizagem da máquina para este problema, os dados das cordas são codificados usando a codificação em um único ponto, onde os valores nas colunas de texto são assumidos como categorias a partir de um conjunto limitado de valores.