ConvNetJS es una biblioteca de Javascript para entrenar modelos de Aprendizaje Profundo (Redes Neuronales) completamente en un navegador.
Stanford CoreNLP proporciona un conjunto de herramientas de análisis de lenguaje natural que pueden dar las formas base de las palabras, sus partes del discurso, si son nombres de empresas, personas, etc., normalizar fechas, horas y cantidades numéricas, y marcar la estructura de las oraciones en términos de frases y dependencias de palabras, indicar qué frases nominales se refieren a las mismas entidades, indicar el sentimiento, extraer relaciones de clase abierta entre menciones, etc.
El etiquetador de partes del discurso (POS Tagger) es un software que lee texto en algún idioma y asigna partes del discurso a cada palabra (y otro token), como sustantivo, verbo, adjetivo, etc., aunque generalmente las aplicaciones computacionales utilizan etiquetas de partes del discurso más detalladas como 'sustantivo-plural'.
Stanford Pattern-based Information Extraction and Diagnostics (SPIED) es una extracción de entidades basada en patrones y visualización que proporciona código para dos componentes, Aprender entidades a partir de texto no etiquetado comenzando con conjuntos de semillas utilizando patrones de manera iterativa y Visualizar y diagnosticar el resultado de uno a dos sistemas.
El Segmentador de Palabras de Stanford actualmente admite árabe y chino, y se ha encontrado que los esquemas de segmentación proporcionados funcionan bien para una variedad de aplicaciones. El sistema requiere que Java 1.8+ esté instalado, y recomienda al menos 1G de memoria para documentos que contienen oraciones largas. Para archivos con oraciones más cortas (por ejemplo, 20 tokens), disminuya el requisito de memoria cambiando la opción java -mx1g en los scripts de ejecución.
Stanford University Unstructured es un marco de código abierto para la simulación de dinámica de fluidos computacional y el diseño óptimo de formas.
Tregex es una utilidad para hacer coincidir patrones en árboles, basada en relaciones de árbol y coincidencias de expresiones regulares en nodos (el nombre es una abreviatura de "expresiones regulares de árbol"). Tregex viene con Tsurgeon, un lenguaje de transformación de árboles. También se incluye desde la versión 2.0 un paquete similar que opera en gráficos de dependencia (clase SemanticGraph, llamado semgrex).
Stanford Phrasal es un sistema de traducción automática basado en frases estadísticas, escrito en Java que proporciona una funcionalidad muy similar al núcleo de Moses, incluye: proporcionar una API fácil de usar para implementar nuevas características del modelo de decodificación, la capacidad de traducir utilizando frases que incluyen huecos (Galley et al. 2010), y la extracción condicional de tablas de frases y modelos de reordenamiento léxico.