https://doi.org/10.35290/ro.v3n2.2022.587
Inteligencia artificial y visión por computadora
aplicada a la educación
Artificial intelligence and computer vision applied to education
Fecha de recepción: 2022-03-25 Fecha de aceptación: 2022-05-06 Fecha de publicación: 2022-06-10
Leonardo Antonio Sánchez López
Jalasoft, Ecuador
Leonardosanchez4h@hotmail.com
https://orcid.org/0000-0002-1436-357X
Resumen
El presente trabajo de investigación realiza una revisión bibliográfica sobre la
inteligencia artificial, la visión por computadora, las herramientas de MediaPipe y
aprendizaje automático, con el objetivo de generar una propuesta de tecnología que
permita mejorar la calidad de las clases. A lo largo del trabajo se describe la situación
actual que tienen los estudiantes respecto a las clases en modalidad virtual, se incluyen
y explican tanto definiciones como el funcionamiento de los distintos temas, al igual
que se incluyen aplicaciones de ellos en la vida cotidiana. De igual manera se incluye el
aporte a la educación que brinda cada uno de los campos, y se realiza un análisis de
trabajos similares. Finalmente, se realiza la propuesta de una herramienta tecnológica
que puede mejorar la calidad de las clases en la modalidad virtual, siendo así, un aporte
para la educación.
Palabras clave: inteligencia artificial, visión por computadora, MediaPipe, educación,
aprendizaje automático
Abstract
This paper carries out a bibliographic review on artificial intelligence, computer vision,
MediaPipe tools and machine learning, with the aim of generating a technology
proposal to improve the quality of classes. Throughout the work the current situation of
students with respect to virtual classes is described, both definitions and the functioning
of the different topics are included and explained, as well as their applications in
everyday life. Likewise, the contribution of each of the fields to education is included,
and an analysis of similar works is made. Finally, a proposal is made for a technological
tool that can improve the quality of classes in the virtual modality, thus being a
contribution to education.
Keywords: artificial intelligence, computer visión, MediaPipe, education, machine
learning
Introducción
Durante la pandemia por covid-19, la cotidianidad cambió a una nueva modalidad
virtual. Tanto el trabajo, como el estudio, y reuniones sociales, tuvieron que pasar a ser
de modo digital; las reuniones virtuales aumentaron y fueron una pieza clave para
continuar con ciertas rutinas. Sin embargo, el cambio de modalidad se dio de forma
súbita, dejando sin cuidado muchas cuestiones importantes. En cuanto a la educación, se
perdió el componente sensorial que brinda el aprendizaje en un aula y la atención
personalizada y guía de un profesor. En vista de esta problemática, se apreció la
necesidad de generar herramientas tecnológicas que puedan contribuir con soluciones.
Es por ello que se revisaron las siguientes definiciones.
La Inteligencia Artificial (IA) y la Visión Computacional (VC) son dos campos
interdisciplinarios que han tenido grandes avances y aplicaciones en un gran rango de
industrias. El objetivo principal de la Visión Computacional es comprender el entorno
de la manera más parecida posible a la percepción humana (Orhei, et al., 2021). Se
busca diseñar software y hardware que interprete lo que le rodea o a lo que se expone
de manera visual y gestione adecuadamente lo que ve. Por otro lado, la Inteligencia
Artificial, en particular su vertiente del Aprendizaje Automático (AA) o Machine
Learning, comprende un rango muy versátil de técnicas que intentan simular el
pensamiento humano en programas y máquinas. Desde redes neuronales que pueden
analizar imágenes o texto, hasta modelos predictivos, el Aprendizaje Automático se
define por su habilidad para aprender los datos a los que es expuesto (Lovejoy et al.,
2021). Está claro que existen similitudes y oportunidades de integración entre la VC y el
AA. En especial, se puede usar el aprendizaje automático para desarrollar mejores
algoritmos de visión computacional, adaptarlos a los requerimientos necesarios y de
este modo aplicarlos en la educación.
Metodología
En primera instancia se describe algo de contexto sobre la educación virtual; de manera
más específica se puede hablar de la educación básica elemental; es decir, segundo,
tercero y cuarto año de básica; en esta etapa, los niños y niñas aprenden de temas
elementales de suma importancia como son: operaciones básicas de matemáticas,
escritura, lectura y temas relacionados a la motricidad fina y gruesa. Este proceso de
aprendizaje se ve entorpecido con la nueva modalidad, debido a la falta de estímulos, a
lo poco interactivo de las clases y a la falta de herramientas que permitan mejorar el
aprendizaje, como bolígrafos digitales o pantallas táctiles con las que se pueda escribir o
dibujar.
Es importante tener en cuenta lo tedioso del aprendizaje al solo tener que observar una
pantalla, sin oportunidad de interactuar, más aún cuando se trata de niños de corta edad.
Esto genera falencias en el aprendizaje y cabe recalcar que es un problema existente
para la educación en todo nivel.
Es por ello que resulta necesario desarrollar tecnología que permita recuperar la
interactividad del aprendizaje y este componente sensorial perdido; en vista de esta
problemática, se realiza una investigación documental en bases de datos académicas que
permiten identificar el estado del arte referente al tema de estudio. En las siguientes
subsecciones se describe lo encontrado.
2.1 Inteligencia artificial (IA)
Existen muchas definiciones para la IA, algunos investigadores prefieren el término
inteligencia aumentada a inteligencia artificial, debido a que esta mantiene el cerebro
humano como fuente de inteligencia, y sitúa al ordenador y sus programas como una
herramienta con la que los humanos pueden mejorar o aumentar sus capacidades
intelectuales. En otras palabras, los ordenadores se emplean para hacer lo que a los
humanos les resulta más difícil (Holmes et al., 2019). Por otro lado, John McCarthy
(2014) la define como la ciencia e ingeniería de crear máquinas inteligentes,
especialmente programas inteligentes. Está relacionada con la tarea similar de utilizar
ordenadores para comprender la inteligencia humana, pero la IA no tiene por qué
limitarse a métodos biológicamente observables.
Es importante resaltar que la idea de inteligencia es también un concepto abstracto y al
crear programas inteligentes en los ordenadores, se debe decidir si el programa pensará
y actuará como un humano o lo hará de forma racional y de igual manera, diseñar los
comandos para que el programa lo haga. Entre las aplicaciones de la IA se tiene el
análisis de grandes cantidades de datos, búsqueda de patrones, optimización de
procesos, resolución de problemas, por mencionar algunos.
La IA y el aprendizaje automático se han investigado recientemente para su uso en
dispositivos móviles, con el objetivo de mejorar la calidad de la computación y abrir
nuevas aplicaciones. Sin embargo, el aprendizaje automático necesita una enorme
potencia de cálculo para llevar a cabo un entrenamiento y un aprendizaje complicados
(Chen et al., 2020).
.
2.1.1 Tipos de IA
IA débil, también llamada IA estrecha, ANI por sus siglas en inglés, es una IA
entrenada y enfocada a realizar tareas específicas. La ANI es el motor de la mayoría de
la IA que está rodeando el mundo hoy en día, pues la utilizan algunas aplicaciones muy
robustas, como Siri de Apple, Alexa de Amazon, IBM Watson y los vehículos
autónomos (IBM, 2020).
IA fuerte, se compone de la Inteligencia General Artificial (AGI) y la Superinteligencia
Artificial (ASI). Este tipo de inteligencia es una forma teórica de IA en la que se habla
de una máquina con inteligencia igual a la de los humanos; con conciencia
autoconsciente y la capacidad de resolver problemas, aprender y planificar el futuro
(IBM, 2020).
Actualmente la IA es un campo bastante estudiado, pues las posibilidades son amplias;
con el poder de análisis de la computadora se pueden crear herramientas tecnológicas
que mejoren la calidad de vida de las personas, así como también optimizar procesos y
metodologías.
2.1.2. IA en la educación
El área de Aprendizaje Asistido por Ordenador (CAL) desarrolla alternativas para
ayudar a los procesos de aprendizaje de los alumnos mediante el uso de tecnología
digital y de IA. La IA puede ayudar a visualizar la trayectoria de aprendizaje de cada
estudiante, así como sus puntos fuertes y débiles, las materias con mejor desempeño y
las preferencias en cuanto a actividades de aprendizaje, Esto quiere decir que la IA
puede personalizar el aprendizaje, ayudar a mejorar el desempeño y brindar opciones a
los estudiantes.
Este trabajo debe realizarse con el apoyo de profesores, padres e instituciones
educativas, mientras el alumno necesite de una guía al utilizar los algoritmos para
ayudar a navegar por diversas rutas curriculares. De igual manera representa una
herramienta potente para aquellos padres que buscan asistir el aprendizaje de sus hijos o
quienes deciden realizar un aprendizaje autodidacta; tenemos el ejemplo de Duolingo o
Elevate, ambas aplicaciones para celular.
Por otro lado, al tener en cuenta la enorme cantidad de tiempo que se dedica a calificar
de forma manual los exámenes y los deberes, se pueden crear herramientas de IA que
aprendan cómo califica un profesor y así optimizar y disminuir el tiempo que el profesor
dedica. La IA no solo se utiliza para calificar exámenes de opción múltiple, sino
también para evaluar ensayos (Pedró et al., 2019).
2.2 Visión por computadora (VC)
La visión por computadora (VC) es una rama de la inteligencia artificial (IA) cuyo
objetivo es permitir que la computadora entienda el mundo por medio del
procesamiento de señales digitales (Wang et al., 2013). Si la IA permite que las
computadoras “piensen”, la VC les permite ver, observar y comprender.
La visión humana es similar a la VC, con la excepción de que las personas tienen una
ventaja inicial, la visión humana distingue objetos, qué tan lejos están, si se están
moviendo y si algo es incorrecto con una imagen de forma relativamente sencilla
gracias al gran poder de procesamiento del cerebro, algo que es limitado con las
computadoras. La VC se emplea en una variedad de industrias, incluidas la energética y
los servicios públicos, la fabricación y la automatización, la medicina, ciencias
computacionales y desde luego, la educación.
2.2.1 ¿Cómo funciona la VC?
Se requiere una gran cantidad de datos y se repite su análisis hasta detectar distinciones
y, eventualmente, reconocer imágenes. Los datos, que en este caso son imágenes,
pueden analizarse de diversas maneras, pues siguen siendo información. Sin embargo,
se debe tener en cuenta que la computadora no puede observar las imágenes como un
humano lo haría. Particularmente se utilizan dos tipos de herramienta para la VC.
Aprendizaje profundo: esta técnica emplea modelos algorítmicos para enseñar a una
computadora sobre el contexto de los datos visuales. Si se suministran suficientes datos
al modelo, la computadora mirarálos datos y aprenderá a distinguir entre las
imágenes. Los algoritmos hacen posible hacer cosas como esta (IBM, 2022).
Red neuronal convolucional (CNN): ayuda al aspectode un modelo de aprendizaje
automático o aprendizaje profundo dividiendo las imágenes en píxeles y asignando
etiquetas a cada píxel. Crea predicciones sobre lo que está viendo”, usando las etiquetas
para hacer convoluciones en varias iteraciones y evalúa la precisión de sus predicciones
hasta que las predicciones comienzan a hacerse realidad. Luego, reconoce imágenes de
una manera similar a la humana (IBM, 2022).
2.2.2 La VC y la educación
La visión por ordenador en la educación puede ayudar a los estudiantes a alcanzar sus
objetivos académicos, proporcionando una experiencia de aprendizaje personalizada
basada en sus puntos fuertes y sus deficiencias. Cuando se compara con la enseñanza
regular en el aula, también puede ayudar con la evaluación y la no obstrucción. La
disponibilidad de cámaras de bajo coste y su uso generalizado en dispositivos
electrónicos como teléfonos móviles y ordenadores permite a los educadores medir los
niveles de compromiso de los alumnos mediante la visión por ordenador, dado que la
tecnología puede interpretar las imágenes digitales capturadas y reaccionar
adecuadamente con la IA y el aprendizaje profundo.
Ya que es imposible observar constantemente la conducta de un estudiante, los sistemas
de visión por computadora brindan varios beneficios al sector de la educación,
especialmente si la modalidad de aprendizaje es virtual. Durante la pandemia por covid,
la educación a nivel mundial cambió de modalidad de forma abrupta; de parte de los
docentes es imposible prestarle atención a cada una de las cámaras de sus alumnos
durante las clases, en el caso de que estén encendidas.
Si bien la visión por computadora permite a los educadores monitorear el
comportamiento de los usuarios mientras enseñan en línea, también ayuda a rastrear la
participación de los estudiantes en las aulas tradicionales. Esto se puede usar para
evaluar los niveles de interés y atención de los estudiantes, y luego los instructores
pueden ajustar sus enfoques de enseñanza para captar más atención y optimizar la
participación de los estudiantes. Finalmente, esta información puede utilizarse para
mejorar las técnicas de enseñanza tradicionales y proporcionar a los estudiantes cursos y
materiales personalizados en función de su capacidad de comprensión.
2.3 Aprendizaje Automático (Machine Learning)
El término Machine Learning (ML) se refiere a un tipo particular de inteligencia
artificial que consiste en entrenar a computadoras para que estas “aprendan” (Romero,
2020). Más en específico, el aprendizaje automático consiste en un conjunto de modelos
matemático-computacionales que buscan la relación entre distintas variables. Así pues,
los problemas que pueden ser abordados por esta disciplina son aquellos que tienen una
representación matemática con variables que pueden o no relacionarse entre sí.
Un modelo de ML “aprende” en cuanto se somete a datos e intenta hallar una relación
entre estos datos de manera probabilística. En todo tipo de modelo existe un aspecto
iterativo que les permite adaptarse a nuevos ambientes de forma independiente
(Romero, 2020). Los modelos se clasifican de acuerdo con la cantidad y tipo de
supervisión que tienen; estos son: Aprendizaje No Supervisado (Unsupervised
Learning), Aprendizaje Supervisado (Supervised Learning), Aprendizaje Semi
Supervisado (Semi Supervised Learning) y Aprendizaje de Reforzamiento
(Reinforcement Learning).
2.3.1 Estrategia detrás de un modelo de aprendizaje automático
De acuerdo con Romero (2020) existen distintas etapas que conforman el proceso detrás
de un modelo de ML. Estas etapas son: comprensión del problema, eeunir los datos,
preparación de datos, elección de modelo, entrenamiento del modelo y evaluación.
Comprensión del problema: determinar el problema que se quiere solucionar y
resolver si se lo puede expresar en términos matemáticos.
Reunir los datos (Data Collection): se refiere a la colección de datos que se relacionen
con el problema a tratar. Este paso puede requerir el uso de hardware especializado
como sensores, trabajo de campo, o herramientas de software que permitan la colección
de información. Es de suma importancia tomar buenas decisiones respecto a la
colección de los datos porque tiene un gran impacto en el modelo. Los datos son
guardados en bases de datos.
Preparación de datos (Feature extraction and data cleaning): normalmente los datos
que se recolectan no están en un formato que pueda ser usado en los modelos de ML.
Por ejemplo, según Chu et al. (2016), los datos pueden estar codificados en reportes
complejos o documentos de libre formato. Para hacer los datos aptos para ser
procesados, es esencial transformarlos a un formato que sea amigable con los
algoritmos de minado de datos y modelos de aprendizaje automático. Estos formatos
pueden ser: multidimensionales, series de tiempo, o semiestructurados. El formato
multidimensional es el más usado, y consiste en uno donde tenemos distintos campos de
datos que corresponden a distintas propiedades medibles que se refieren como
características, atributos, variables, o dimensiones. Es crucial saber qué atributos son
relevantes y cuáles no para el problema a tratar. En general, el proceso de extracción de
atributos se hace a la par que la limpieza de los datos, donde datos erróneos o faltantes
son estimados o corregidos.
Elección de modelo (Analytical processing and algorithms): En esta sección se deben
elegir métodos analíticos efectivos que puedan trabajar con los datos procesados.
Entrenamiento del modelo (Train the model): Se aplica el modelo de forma iterativa
sobre el test de entrenamiento.
Evaluación del modelo (Evaluate the model): Se prueba el modelo con el test de
prueba.
Una de las aplicaciones del aprendizaje automático con mayores avances es el campo
del reconocimiento de imágenes.
2.4 Reconocimiento de Imágenes mediante Machine Learning
De acuerdo con Martínez (2018) el reconocimiento de imágenes se ha visto desarrollado
ampliamente mediante el uso de modelos de aprendizaje automático “debido a su gran
utilidad social y a la mejora en tiempo y precisión que su desempeño ofrece compara
con el de los humanos”. El reconocimiento de imágenes se refiere a los mecanismos que
identifican de forma automática objetos dentro de imágenes proyectadas relacionados
con formas, tamaños, colores, etcétera (Builes y Palacio, 2015).
Este proceso también tiene sus partes como cualquier proceso de ML, y son las de:
adquisición de imágenes, pre-procesamiento, segmentación, extracción de rasgos y
clasificación.
Hay diversos algoritmos usados para el reconocimiento de imágenes. Una de las
familias más usadas es la familia HOG (Histogramas de Orientación del Gradiente).
Estos algoritmos se basan en la división de la imagen en celdas de tamaño fijo, donde en
cada una de ellas se realiza un cálculo de un histograma de sus orientaciones y se
describe sus contenidos para obtener una descripción global de toda la imagen. El
método consiste en la asignación de píxeles en intervalos de acuerdo a su gradiente
(Martínez, 2018).
2.5 MediaPipe
Internamente desde 2012, Google lo ha estado utilizando en una variedad de productos
y servicios, con la intención de analizar video y audio en tiempo real en YouTube. Se
integró de manera gradual en muchos productos adicionales, incluido el sistema de
percepción de NestCam, la identificación de objetos de Google Lens y Gmail, entre
otros. MediaPipe es el cerebro detrás de algunos de los productos y servicios más
innovadores que se usan a diario. A diferencia de otros marcos de aprendizaje
automático que usan mucha potencia, MediaPipe utiliza muy poca. Es tan pequeño y
eficiente que puede funcionar en dispositivos IoT integrados.
Con una denominación más técnica, se define a MediaPipe como una framework, para
crear canalizaciones de aprendizaje automático para datos de series temporales, como
video y audio. Está diseñado para los profesionales del aprendizaje automático (ML),
incluyendo investigadores, estudiantes y desarrolladores de software, y su principal uso
es el prototipado rápido de puntos de referencia en imágenes con modelos de inferencia
y otros componentes reutilizables (Lugaresi et al., 2019). Este marco multiplataforma es
compatible con escritorio/servidor, Android, iOS y dispositivos integrados como
Raspberry Pi y Jetson Nano.
2.5.1 ¿MediaPipe funciona en tiempo real?
Las soluciones que ofrece MediaPipe no siempre funcionan en tiempo real, pues las
soluciones se construyen sobre MediaPipe Framework que proporciona la API de
calculadora (C++), la API de construcción de gráficos (Protobuf) y la API de ejecución
de gráficos (C++, Java, Obj-C). Con las API, se pueden construir gráficos y escribir
calculadoras personalizadas. El Toolkit es excelente, pero su rendimiento depende del
hardware subyacente. Por ejemplo, si se hace una comparación en dos computadores
diferentes, es probable que en uno se vea un video HD (1280 × 720) y en el otro un
video Ultra HD (3840 × 2160). Esto indica que la eficiencia de MediaPipe está
directamente correlacionada con el hardware del equipo en el cual esté corriendo. Por
eso se puede plantear de manera natural la siguiente pregunta: ¿cómo podría ayudar
MediaPipe en la educación en tiempo de pandemia? y ¿cuáles son los requerimientos
mínimos para su uso?
2.6 Reconocimiento de manos
El reconocimiento de gestos con la mano (HGR) es una forma natural e intuitiva de
interacción persona-ordenador (HCI), que ha sido objeto de numerosos estudios; con
una amplia gama de dispositivos de entrada y enfoques, el HGR basado en el esqueleto
se convirtió en una opción popular debido a su resistencia a las fluctuaciones del fondo
y la luz (Sung et al., 2021). Entre las herramientas utilizadas para el reconocimiento de
gestos con la mano, MediaPipe dispone de una solución para ella; esta emplea el ML
para inferir 21 puntos de referencia en 3D de una mano, a partir de un solo fotograma
(MediaPipe, 2020), como se presenta en la Figura 1.
Figura 1
Puntos de referencia en la mano
Nota. MediaPipe (2020)
Resultados
Se ha encontrado que las diferentes herramientas tecnológicas pueden ser de mucho
beneficio para la educación. El área de investigación tanto de la IA y la CV permite
explorar una gran variedad de opciones para darle solución a las diversas problemáticas,
resultado de la modalidad virtual en la educación. Resulta de especial interés el
reconocimiento de gestos de la mano utilizando las herramientas de MediaPipe y se
plantea el generar tecnologías de alto impacto para la educación. Por otro lado, es
necesario tener en cuenta los requerimientos básicos para que el software de MediaPipe
funcione en los distintos dispositivos que tienen a disposición tanto estudiantes como
maestros. Asimismo, en temas de calidad de video, tamaño de la pantalla y conexión a
internet.
3.1 Discusión: pizarra virtual
Con la herramienta de reconocimiento de gestos de la mano, se propone realizar un
prototipo de pizarra virtual que pueda ser utilizada durante las clases en modalidad
virtual. Mientras se tenga la cámara activa, la pizarra debe detectar las manos de los
estudiantes y mediante gestos con ellas permitirles dibujar sobre la imagen del video.
De igual manera debe permitir borrar los trazos. La interfaz queda a decisión del
desarrollador y los requerimientos de la institución o profesor que desee utilizar el
programa. Finalmente se recomienda tener en consideración los dispositivos a los que
profesores y alumnos tengan acceso en el momento de desarrollo.
Conclusiones
La educación se vio afectada por el cambio de modalidad abrupto, resultado de la
pandemia por covid-19; se perdió mucho del componente sensorial que era clave para el
aprendizaje de los niños y niñas de distintas edades, en especial de aquellos cursando el
periodo importante de la educación elemental.
Se revisó información existente sobre la IA y la VC y se determinó que ambas son
herramientas muy útiles para generar tecnología e innovar. MediaPipe es una
herramienta de libre acceso, potente y compacta con la que se pueden desarrollar
algoritmos y programas robustos pero compactos. Estas herramientas son usadas en la
educación, la IA principalmente se ha usado en el ámbito administrativo y la VC en
temas de monitoreo de comportamiento; sin embargo, al juntarlas se puede crear una
herramienta más didáctica que mejore el aprendizaje en la modalidad virtual por lo que
se propone desarrollar un modelo de pizarra virtual.
Es importante considerar el acceso que tengan padres, alumnos y profesores a los
requerimientos tecnológicos básicos para poder utilizar las distintas herramientas
tecnológicas. Esto debido a que por mejor que sea la tecnología creada, esta se vuelve
obsoleta si no se puede utilizar o, a su vez, si no se puede utilizar de forma óptima.
Referencias
Builes, A., y Palacio, E. (2015). Aplicación del reconocimiento de imágenes para la
manipulación robótica de objetos en movimiento [Tesis de grado, Universidad
Pontificia Bolivariana]. https://repository.upb.edu.co/handle/20.500.11912/2452
Chen, L., Chen, P., & Lin, Z. (2020). Artificial Intelligence in Education: A Review.
IEEE Access, 8, 7526475278. https://doi.org/10.1109/access.2020.2988510
Chu, X., Ilyas, I., Krishnan, S., & Wang, J. (2016). Data cleaning: overview and
emerging challenges. In Sigmod’16: Proceedings of the 2016 international conference
on management of data (pp. 2201-2206). https://doi.org/10.1145/2882903.2912574
Holmes, W., Bialik, M., & Fadel, C. (2019). Artificial Intelligence in Education:
Promises and Implications for Teaching and Learning. The Center for Curriculum
Redesign.
IBM. (03 de junio de 2020). What is Artificial Intelligence (AI)?
https://www.ibm.com/cloud/learn/what-is-artificial-intelligence
IBM. (2022). What is Computer Vision? https://www.ibm.com/topics/computer-
vision#:~:text=Computer%20vision%20is%20a%20field,recommendations%20based%
20on%20that%20information .
Lovejoy, C., Abbas, A., & Ratneswaran, D. (2021). An introduction to artificial
intelligence in sleep medicine. Journal Of Thoracic Disease, 13(10), 6095-6098.
doi:10.21037/jtd-21-1569
Lugaresi, C., Tang, J., Nash, H., McClanahan, C., Uboweja, E., Hays, M., Zhang, F.,
Chang, C., Yong, M., Lee, J., Chang, W., Hua, W., Georg, M. & Grundmann, M.
(2019). MediaPipe: A Framework for Building Perception Pipelines. arXiv preprint
https://doi.org/10.48550/arXiv.1906.08172
Martínez, J. (2018). Reconocimiento de imágenes mediante redes neuronales
convolucionales [Tesis de grado, Universidad Politécnica de Madrid].
https://oa.upm.es/53050/
MediaPipe. (2020). MediaPipe Hands. https://google.github.io/mediapipe/solutions/hands
McCarthy, J. (2017). What is AI? / Basic Questions. Stanford University.
http://jmc.stanford.edu/artificial-intelligence/what-is-ai/index.html
Orhei, C., Vert, S., Mocofan, M., & Vasiu, R. (2021). End-To-End Computer Vision
Framework: An Open-Source Platform for Research and Education. Sensors, 21(11), 3691.
https://doi.org/10.3390/s21113691
Pedró, F., Subosa, M., Rivas, A. y Valverde, P. (2019). Artificial Intelligence in education:
challenges and opportunities for sustainable development. UNESCO.
https://unesdoc.unesco.org/ark:/48223/pf0000366994
Romero, B. (2020). Una introducción a los modelos de Machine Learning [Tesis de grado,
Benemérita Universidad Autónoma de Puebla] https://hdl.handle.net/20.500.12371/10527
Sung, G., Sokal, K., Uboweja, E., Bazarevsky, V., Baccash, J., Bazavan, E, Chang, C., &
Grundmann, M. (2021). On-device Real-time Hand Gesture Recognition. arXiv preprint.
https://doi.org/10.48550/arXiv.2111.00038
Wang, C., Komodakis, N., & Paragios, N. (2013). Markov Random Field modeling, inference &
learning in computer vision & image understanding: A survey. Computer Vision and Image
Understanding, 117(11), 16101627. http://dx.doi.org/10.1016/j.cviu.2013.07.004
Copyright (2022) © Leonardo Antonio Sánchez López
Este texto está protegido bajo una licencia internacional Creative Commons 4.0.
Usted es libre para Compartircopiar y redistribuir el material en cualquier medio o
formato y Adaptar el documento remezclar, transformar y crear a partir del
materialpara cualquier propósito, incluso para fines comerciales, siempre que cumpla
las condiciones de Atribución. Usted debe dar crédito a la obra original de manera
adecuada, proporcionar un enlace a la licencia, e indicar si se han realizado cambios.
Puede hacerlo en cualquier forma razonable, pero no de forma tal que sugiera que tiene
el apoyo del licenciante o lo recibe por el uso que hace de la obra.
Resumen de licencia Texto completo de la licencia