<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>CLIP on KnightLi Blog</title>
        <link>https://knightli.com/es/tags/clip/</link>
        <description>Recent content in CLIP on KnightLi Blog</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>es</language>
        <lastBuildDate>Sat, 11 Apr 2026 08:27:57 +0800</lastBuildDate><atom:link href="https://knightli.com/es/tags/clip/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>Qué modelos impulsan las fotos AI de fnOS: pila de caras, objetos y búsqueda semántica</title>
        <link>https://knightli.com/es/2026/04/11/fnos-ai-photo-model-stack/</link>
        <pubDate>Sat, 11 Apr 2026 08:27:57 +0800</pubDate>
        
        <guid>https://knightli.com/es/2026/04/11/fnos-ai-photo-model-stack/</guid>
        <description>&lt;p&gt;La función de fotos AI en Feiniu NAS (fnOS) normalmente se construye integrando modelos open source convencionales, no entrenando desde cero todos los algoritmos principales.&lt;/p&gt;
&lt;h2 id=&#34;1-reconocimiento-facial-insightface&#34;&gt;1) Reconocimiento facial: InsightFace
&lt;/h2&gt;&lt;p&gt;Para las funciones relacionadas con caras, InsightFace suele ser el núcleo.&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Método común de aprendizaje de características: ArcFace&lt;/li&gt;
&lt;li&gt;Papel principal: detección de rostros, extracción de embeddings, clustering y reconocimiento de personas&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;2-detección-de-objetos-y-comprensión-de-escenas-familia-yolo&#34;&gt;2) Detección de objetos y comprensión de escenas: familia YOLO
&lt;/h2&gt;&lt;p&gt;La detección de objetos en fotos, como gatos, perros, coches o computadoras, y parte de la comprensión de escenas suelen gestionarse con modelos YOLO, a menudo YOLOv8 o variantes ligeras.&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Ventaja: buen equilibrio entre precisión y velocidad&lt;/li&gt;
&lt;li&gt;Encaje: entornos NAS de borde con capacidad de cómputo limitada&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;3-búsqueda-semántica-clip--chinese-clip&#34;&gt;3) Búsqueda semántica: CLIP / Chinese-CLIP
&lt;/h2&gt;&lt;p&gt;Una capacidad clave es la búsqueda de fotos con lenguaje natural, por ejemplo &amp;ldquo;un perro en el césped&amp;rdquo; o &amp;ldquo;un hombre con gafas de sol&amp;rdquo;.&lt;/p&gt;
&lt;p&gt;La implementación típica usa CLIP:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;las imágenes y los textos se proyectan al mismo espacio vectorial&lt;/li&gt;
&lt;li&gt;en despliegues chinos, normalmente se combina con Chinese-CLIP o variantes localizadas similares&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;resumen&#34;&gt;Resumen
&lt;/h2&gt;&lt;p&gt;Una forma sencilla de ver la pila de fotos AI de fnOS:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;InsightFace para caras&lt;/li&gt;
&lt;li&gt;YOLO para objetos y escenas&lt;/li&gt;
&lt;li&gt;CLIP para alinear lenguaje humano e imagen&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;El valor principal está en la integración de ingeniería, la localización y la optimización con aceleración por hardware, más que en inventar modelos base desde cero.&lt;/p&gt;
</description>
        </item>
        
    </channel>
</rss>
