¿Cuál es la forma simple de poblar una ontología usando texto anotado?

Se calculan las similitudes entre textos y se agrupan. Esto debería ayudarlo a clasificar los textos en un primer paso. Luego, en lugar de simplemente clasificarlos, irá por una experiencia más fina a través de temas. Mediante el uso de LDA o algoritmos de extracción de temas similares, debería poder crear un buen conjunto de temas para cada documento. Si desea hacerlo según el libro, también puede agregar alguna Resolución de entidad nombrada y diferenciar temas de entidades. Una vez que se realizan estos pasos, es posible que necesite o no algunos algoritmos para el ordenamiento temporal de los conceptos, eventos o entidades. Una vez que se realizan todos estos pasos, es suficiente simplemente crear una jerarquía que contenga todos estos conceptos (temas), eventos o entidades. Si es simplemente un TBox (cuadro de terminología), no contendrá ninguna instancia (por ejemplo, solo conceptos como automóvil, árbol, nave espacial). Si también agrega los hechos extraídos del texto (por ejemplo, Barack Obama se casó con Michelle Obama), también tendrá un ABox (cuadro de afirmación). Entonces simplemente podrá utilizar la lógica o varios tipos de aprendizaje automático para obtener aún más información. La ontología en sí misma generalmente es simplemente el TBox.