Por sí sola o combinada con otras tecnologías (por ejemplo, sensores, geolocalización, robótica), la IA puede realizar tareas que de otro modo requerirían inteligencia o intervención humana. Los asistentes digitales, la guía por GPS, los vehículos autónomos y las herramientas de inteligencia artificial generativa (como Chat GPT de Open AI) son solo algunos ejemplos de inteligencia artificial en las noticias diarias y en nuestra vida diaria.
Como campo de la informática, la inteligencia artificial abarca (y a menudo se menciona junto con) el aprendizaje automático y el aprendizaje profundo. Estas disciplinas implican el desarrollo de algoritmos de IA, modelados a partir de los procesos de toma de decisiones del cerebro humano, que pueden “aprender” de los datos disponibles y hacer clasificaciones o predicciones cada vez más precisas con el tiempo.
La inteligencia artificial ha pasado por muchos ciclos de exageración, pero incluso para los escépticos, el lanzamiento de ChatGPT parece marcar un punto de inflexión. La última vez que la IA generativa cobró tanta importancia, los avances se produjeron en la visión por computadora, pero ahora el salto adelante está en el procesamiento del lenguaje natural (PLN). Hoy en día, la IA generativa puede aprender y sintetizar no sólo el lenguaje humano sino también otros tipos de datos, como imágenes, vídeos, códigos de software e incluso estructuras moleculares.
Las aplicaciones de IA crecen cada día. Pero a medida que aumenta el revuelo en torno al uso de herramientas de IA en las empresas, las conversaciones sobre la ética de la IA y su responsabilidad se vuelven de vital importancia. Para obtener más información sobre la postura de IBM sobre estos temas, lea Crear confianza en la IA.
Tipos de inteligencia artificial: IA débil versus IA fuerte
La IA débil, también conocida como IA estrecha o inteligencia artificial estrecha (ANI), es una IA entrenada y enfocada para realizar tareas específicas. La IA débil impulsa la mayor parte de la IA que nos rodea hoy. "Estrecho" podría ser un descriptor más adecuado para este tipo de IA, ya que no es nada débil: permite algunas aplicaciones muy sólidas, como Siri de Apple, Alexa de Amazon, IBM watsonx™ y vehículos autónomos.
La IA fuerte se compone de inteligencia artificial general (AGI) y superinteligencia artificial (ASI). AGI, o IA general, es una forma teórica de IA en la que una máquina tendría una inteligencia igual a la de los humanos; sería consciente de sí mismo y tendría una conciencia que tendría la capacidad de resolver problemas, aprender y planificar el futuro. La ASI, también conocida como superinteligencia, superaría la inteligencia y la capacidad del cerebro humano. Si bien la IA fuerte sigue siendo completamente teórica y no hay ejemplos prácticos en uso hoy en día, eso no significa que los investigadores de IA no estén explorando también su desarrollo. Mientras tanto, los mejores ejemplos de ASI podrían ser de ciencia ficción, como HAL, el asistente informático sobrehumano y rebelde en 2001: Una odisea en el espacio.
Aprendizaje profundo versus aprendizaje automático
El aprendizaje automático y el aprendizaje profundo son subdisciplinas de la IA, y el aprendizaje profundo es una subdisciplina del aprendizaje automático.
Tanto los algoritmos de aprendizaje automático como los de aprendizaje profundo utilizan redes neuronales para "aprender" de grandes cantidades de datos. Estas redes neuronales son estructuras programáticas modeladas a partir de los procesos de toma de decisiones del cerebro humano. Consisten en capas de nodos interconectados que extraen características de los datos y hacen predicciones sobre lo que representan los datos.
El aprendizaje automático y el aprendizaje profundo difieren en los tipos de redes neuronales que utilizan y en la cantidad de intervención humana involucrada. Los algoritmos clásicos de aprendizaje automático utilizan redes neuronales con una capa de entrada, una o dos capas "ocultas" y una capa de salida. Normalmente, estos algoritmos se limitan al aprendizaje supervisado: los datos deben ser estructurados o etiquetados por expertos humanos para permitir que el algoritmo extraiga características de los datos.
Los algoritmos de aprendizaje profundo utilizan redes neuronales profundas: redes compuestas por una capa de entrada, tres o más (pero generalmente cientos) de capas ocultas y un diseño de salida. Estas múltiples capas permiten el aprendizaje no supervisado: automatizan la extracción de características de conjuntos de datos grandes, sin etiquetar y desestructurados. Como no requiere intervención humana, el aprendizaje profundo esencialmente permite el aprendizaje automático a escala.
El auge de los modelos generativos
La IA generativa se refiere a modelos de aprendizaje profundo que pueden tomar datos sin procesar (por ejemplo, toda Wikipedia o las obras recopiladas de Rembrandt) y “aprender” a generar resultados estadísticamente probables cuando se les solicite. En un nivel alto, los modelos generativos codifican una representación simplificada de sus datos de entrenamiento y se basan en ellos para crear un nuevo trabajo que es similar, pero no idéntico, a los datos originales.
Los modelos generativos se han utilizado durante años en estadística para analizar datos numéricos. Sin embargo, el auge del aprendizaje profundo hizo posible extenderlo a imágenes, voz y otros tipos de datos complejos. Entre la primera clase de modelos de IA que lograron esta hazaña cruzada se encontraban los codificadores automáticos variacionales, o VAE, introducidos en 2013. Los VAE fueron los primeros modelos de aprendizaje profundo que se utilizaron ampliamente para generar imágenes y voz realistas.
"Los VAE abrieron las compuertas al modelado generativo profundo al hacer que los modelos sean más fáciles de escalar", dijo Akash Srivastava, experto en IA generativa en el Laboratorio de IA Watson del MIT-IBM. "Gran parte de lo que hoy consideramos IA generativa comenzó aquí".
Los primeros ejemplos de modelos, incluidos GPT-3, BERT o DALL-E 2, han demostrado lo que es posible. En el futuro, los modelos se entrenarán con un amplio conjunto de datos sin etiquetar que se pueden utilizar para diferentes tareas, con un ajuste mínimo. Los sistemas que ejecutan tareas específicas en un único dominio están dando paso a sistemas de inteligencia artificial más amplios que aprenden de manera más general y trabajan en todos los dominios y problemas. Los modelos básicos, entrenados en grandes conjuntos de datos sin etiquetar y ajustados para una variedad de aplicaciones, están impulsando este cambio.
En cuanto al futuro de la IA, en lo que respecta a la IA generativa, se predice que los modelos básicos acelerarán drásticamente la adopción de la IA en las empresas. La reducción de los requisitos de etiquetado hará que sea mucho más fácil para las empresas sumergirse en ello, y la automatización altamente precisa y eficiente impulsada por la IA que permiten significará que muchas más empresas podrán implementar la IA en una gama más amplia de situaciones de misión crítica. Para IBM, la esperanza es que la potencia informática de los modelos básicos pueda eventualmente llevarse a todas las empresas en un entorno de nube híbrida sin fricciones.
Aplicaciones de inteligencia artificial
En la actualidad, existen numerosas aplicaciones del mundo real para los sistemas de IA. A continuación se detallan algunos de los casos de uso más comunes:
Reconocimiento de voz
También conocido como reconocimiento automático de voz (ASR), reconocimiento de voz por computadora o voz a texto, el reconocimiento de voz utiliza PNL para procesar el habla humana en un formato escrito. Muchos dispositivos móviles incorporan reconocimiento de voz en sus sistemas para realizar búsquedas por voz (Siri, por ejemplo) o proporcionar más accesibilidad para enviar mensajes de texto en inglés o en muchos idiomas ampliamente utilizados. Vea cómo Don Johnston utilizó IBM Watson Text to Speech para mejorar la accesibilidad en el aula con nuestro caso de estudio.
Servicio al Cliente
Los agentes virtuales en línea y los chatbots están reemplazando a los agentes humanos a lo largo del recorrido del cliente. Responden preguntas frecuentes (FAQ) sobre temas como el envío, o brindan asesoramiento personalizado, venta cruzada de productos o sugerencias de tamaños para los usuarios, cambiando la forma en que pensamos sobre la participación del cliente en los sitios web y plataformas de redes sociales. Los ejemplos incluyen bots de mensajería en sitios de comercio electrónico con agentes virtuales, aplicaciones de mensajería, como Slack y Facebook Messenger, y tareas que normalmente realizan asistentes virtuales y asistentes de voz. Vea cómo Autodesk Inc. utilizó IBM watsonx Assistant para acelerar los tiempos de respuesta de los clientes en un 99 % con nuestro estudio de caso.
Visión por computador
Esta tecnología de inteligencia artificial permite que las computadoras y los sistemas obtengan información significativa a partir de imágenes digitales, videos y otras entradas visuales y, en función de esas entradas, pueden tomar medidas. Esta capacidad de proporcionar recomendaciones lo distingue de las tareas de reconocimiento de imágenes. Impulsada por redes neuronales convolucionales, la visión por computadora tiene aplicaciones en el etiquetado de fotografías en las redes sociales, imágenes radiológicas en la atención médica y automóviles autónomos dentro de la industria automotriz.
Cadena de suministro
La robótica adaptativa actúa sobre la información de los dispositivos de Internet de las cosas (IoT) y sobre datos estructurados y no estructurados para tomar decisiones autónomas. Las herramientas de PNL pueden comprender el habla humana y reaccionar a lo que se les dice. El análisis predictivo se aplica a la capacidad de respuesta de la demanda, la optimización del inventario y la red, el mantenimiento preventivo y la fabricación digital. Los algoritmos de búsqueda y reconocimiento de patrones, que ya no son solo predictivos, sino jerárquicos, analizan datos en tiempo real, ayudando a las cadenas de suministro a reaccionar a la inteligencia aumentada generada por máquinas, al tiempo que brindan visibilidad y transparencia instantáneas.
Predicción del tiempo
Los modelos meteorológicos en los que se basan las emisoras para hacer pronósticos precisos consisten en complejos algoritmos ejecutados en supercomputadoras. Las técnicas de aprendizaje automático mejoran estos modelos haciéndolos más aplicables y precisos.
Historia de la inteligencia artificial: fechas clave y nombres
La idea de "una máquina que piensa" se remonta a la antigua Grecia. Pero desde la llegada de la informática electrónica (y en relación con algunos de los temas tratados en este artículo), los acontecimientos e hitos importantes en la evolución de la inteligencia artificial incluyen los siguientes:
⊳ 1950: Alan Turing publica Computing Machinery and Intelligence. En este artículo, Turing, famoso por descifrar el código ENIGMA alemán durante la Segunda Guerra Mundial y a menudo referido como el "padre de la informática", plantea la siguiente pregunta: "¿Pueden pensar las máquinas?" A partir de ahí, ofrece una prueba, ahora conocida como la "Prueba de Turing", en la que un interrogador humano intentaría distinguir entre una respuesta de texto de computadora y humana. Si bien esta prueba ha sido objeto de mucho escrutinio desde su publicación, sigue siendo una parte importante de la historia de la IA, así como un concepto continuo dentro de la filosofía, ya que utiliza ideas relacionadas con la lingüística.
⊳ 1956: John McCarthy acuña el término "inteligencia artificial" en la primera conferencia sobre IA en Dartmouth College. (McCarthy inventaría el lenguaje Lisp). Más tarde ese año, Allen Newell, J.C. Shaw y Herbert Simon crean Logic Theorist, el primer programa de software de IA en ejecución.
⊳ 1967: Frank Rosenblatt construye el perceptrón Mark 1, la primera computadora basada en una red neuronal que "aprendió" mediante prueba y error. Apenas un año después, Marvin Minsky y Seymour Papert publican un libro titulado Perceptrones, que se convierte a la vez en el trabajo histórico sobre redes neuronales y, al menos por un tiempo, en un argumento contra futuros proyectos de investigación de redes neuronales.
Década de 1980: Las redes neuronales que utilizan un algoritmo de retropropagación para entrenarse se vuelven ampliamente utilizadas en aplicaciones de IA.
⊳ 1995: Stuart Russell y Peter Norvig publican Inteligencia artificial: un enfoque moderno, que se convierte en uno de los libros de texto líderes en el estudio de la IA. En él, profundizan en cuatro posibles objetivos o definiciones de la IA, que diferencia los sistemas informáticos en función de la racionalidad y el pensamiento versus la acción.
⊳ 1997: Deep Blue de IBM vence al entonces campeón mundial de ajedrez Garry Kasparov, en una partida de ajedrez (y revancha).
⊳ 2004: John McCarthy escribe un artículo, ¿Qué es la inteligencia artificial? y propone una definición de IA que se cita con frecuencia.
⊳ 2011: IBM Watson vence a los campeones Ken Jennings y Brad Rutter en Jeopardy!
⊳ 2015: La supercomputadora Minwa de Baidu utiliza un tipo especial de red neuronal profunda llamada red neuronal convolucional para identificar y categorizar imágenes con una tasa de precisión más alta que la del ser humano promedio.
⊳ 2016: El programa AlphaGo de DeepMind, impulsado por una red neuronal profunda, vence a Lee Sodol, el campeón mundial de Go, en una partida de cinco juegos. La victoria es significativa dada la enorme cantidad de movimientos posibles a medida que avanza el juego (¡más de 14,5 billones después de sólo cuatro movimientos!). Más tarde, Google compró DeepMind por 400 millones de dólares.
⊳ 2023: Un aumento en los grandes modelos de lenguaje, o LLM, como ChatGPT, crea una
enorme cambio en el rendimiento de la IA y su potencial para impulsar el valor empresarial. Con estas nuevas prácticas de IA generativa, los modelos de aprendizaje profundo se pueden entrenar previamente con grandes cantidades de datos sin procesar y sin etiquetar.