La función de fotos AI en Feiniu NAS (fnOS) normalmente se construye integrando modelos open source convencionales, no entrenando desde cero todos los algoritmos principales.
1) Reconocimiento facial: InsightFace
Para las funciones relacionadas con caras, InsightFace suele ser el núcleo.
- Método común de aprendizaje de características: ArcFace
- Papel principal: detección de rostros, extracción de embeddings, clustering y reconocimiento de personas
2) Detección de objetos y comprensión de escenas: familia YOLO
La detección de objetos en fotos, como gatos, perros, coches o computadoras, y parte de la comprensión de escenas suelen gestionarse con modelos YOLO, a menudo YOLOv8 o variantes ligeras.
- Ventaja: buen equilibrio entre precisión y velocidad
- Encaje: entornos NAS de borde con capacidad de cómputo limitada
3) Búsqueda semántica: CLIP / Chinese-CLIP
Una capacidad clave es la búsqueda de fotos con lenguaje natural, por ejemplo “un perro en el césped” o “un hombre con gafas de sol”.
La implementación típica usa CLIP:
- las imágenes y los textos se proyectan al mismo espacio vectorial
- en despliegues chinos, normalmente se combina con Chinese-CLIP o variantes localizadas similares
Resumen
Una forma sencilla de ver la pila de fotos AI de fnOS:
- InsightFace para caras
- YOLO para objetos y escenas
- CLIP para alinear lenguaje humano e imagen
El valor principal está en la integración de ingeniería, la localización y la optimización con aceleración por hardware, más que en inventar modelos base desde cero.