analisis-jurisprudencial

La voz como bien jurídico protegible en el contexto de la síntesis de IA: análisis doctrinal de Lehrman v. Lovo (2025)

La Voz como Bien Jurídico Protegible en el Contexto de la Síntesis de IA: Análisis Doctrinal de Lehrman v. Lovo, Inc. (2025)


RESUMEN EJECUTIVO

La sentencia Lehrman v. Lovo, Inc. (S.D.N.Y. 2025) representa un punto de inflexión en el reconocimiento de la voz humana como objeto de protección jurídica autónoma, más allá del copyright tradicional. El tribunal rechaza categóricamente la extensión del derecho de autor a las voces qua voces (como entidad abstracta), pero sienta un fundamento sólido para su protección bajo la normativa neoyorquina de derechos civiles (NYCRL §§ 50-51), específicamente dirigida a la misappropriation de la personalidad.

La cuestión central es: ¿pueden los actores de voz reclamar protección contra la síntesis y comercialización de clones vocales sin consentimiento, incluso cuando esos clones son simulaciones independientes y no reproducciones literales de sus grabaciones originales? La sentencia responde afirmativamente, pero lo hace no mediante la expansión del derecho de autor, sino mediante la reinterpretación pragmática de una normativa decimonónica diseñada para proteger la "identidad personal" contra apropiaciones comerciales.

Este análisis expone la arquitectura doctrinal de la decisión, sus fricciones internas, su resonancia con el debate comparado europeo (especialmente el AI Act), y las implicaciones sistémicas para el derecho de la IA y la gobernanza de sistemas que generan contenido sintético.


I. DELIMITACIÓN DEL PROBLEMA JURÍDICO

1.1 Núcleo de Fricción

La sentencia enfrenta una colisión frontal entre tres regímenes normativos que históricamente no fueron diseñados para coexistir:

A) Copyright: Diseñado para proteger expresiones fijas en soportes tangibles. El § 114(b) de la Copyright Act excluye expresamente la protección de "imitaciones independientes" de sonidos protegidos, incluso cuando son extremadamente similares. El clon de voz generado por IA, aunque acústicamente indistinguible, no es una "fijación idéntica" del original, sino una nueva grabación que replica atributos.

B) Lanham Act (falsa asociación / §43(a)(1)(A)): Diseñado para proteger contra la confusión del consumidor sobre el origen o patrocinio de bienes/servicios. Requiere un "mark" (marca distintiva) que funcione como identificador de fuente. Aquí radica la tensión: ¿funciona la voz como marca (identificador de fuente) o como producto en sí mismo?

C) NYCRL §§50-51 (protección de la personalidad): Normativa de 1903 que prohíbe el uso comercial de la "voz" de una persona sin consentimiento escrito. Originalmente concebida para fotografías y litografías de rostros; expandida jurisprudencialmente a avatares digitales (Lohan v. Take-Two, 2018).

1.2 La Pregunta Doctrinal

El tribunal debe resolver: ¿es la voz sintetizada un acto de infracción de copyright (copia no autorizada) o un acto de misappropriation de la identidad personal (uso no consentido con fines comerciales)?

Esta pregunta no es meramente clasificatoria. Tiene consecuencias sistémicas:

  • Si es copyright: la protección depende de "expresión original fija", y los clones sintéticos escapa por la brecha del § 114(b).
  • Si es identidad: la protección es más amplia, pero está limitada territorialmente (New York), temporalmente (1 año de estatuto de limitaciones con posible excepción de "republication"), y sustantivamente (solo si hay "recognizability").

1.3 Contexto Tecnológico Relevante

Lovo utiliza "voice cloning" mediante aprendizaje automático supervisado: ingiere muestras vocales de Lehrman y Sage (en total, poco más de 1 hora de audio), y entrena un modelo generativo que captura patrones acústicos paramétricos de su voz (pitch, formantes, duración, respiración, timbre, etc.). Luego, Genny puede sintetizar nuevas frases que nunca fueron pronunciadas por los actores originales, pero que suenan "prácticamente indistinguibles" de ellas.

Implicación jurídica clave: No hay copia literal de grabaciones originales en el output; hay simulación estadística de rasgos vocales identificables.


II. MATRIZ NORMATIVA Y JERARQUÍA DE FUENTES

2.1 Copyright Act (Derecho Federal de EE.UU.)

Jerarquía: Primaria (estatuto federal).

Disposiciones relevantes:

  • § 102(a)(7): Sound recordings como obra protegible.
  • § 106(1)-(2): Derechos exclusivos de reproducción y derivación.
  • § 114(b): Salvedad crucial: "El derecho de derivación [...] no se extiende a la fabricación o duplicación de otro sound recording que consista enteramente en una fijación independiente de otros sonidos, aunque tales sonidos imiten o simulen los del sound recording protegido."
  • § 204: Requisito de "written agreement" para transferencia de derechos de autor.

Interpretación adoptada por el tribunal: El § 114(b) es taxativo. Un clon sintético, aunque sea "practically indistinguishable," no es una "fijación" (fixing) del sonido original. Es una nueva fijación que simula atributos. Por lo tanto, no infringe derechos de autor, incluso si fue entrenado usando grabaciones originales sin consentimiento.

Fricción interna: El tribunal reconoce implícitamente que el § 114(b) crea una "brecha" en la protección: permite que una empresa comercialice una réplica vocal de un artista sin infringir copyright, lo cual frustra la intención de los actores de retener control sobre la representación de su voz.

2.2 Lanham Act § 43(a) — Análisis Bifurcado

§ 43(a)(1)(A) — Falsa asociación / Infringement de marca no registrada:

Elemento clave: Protección de una "distinctive mark" que funciona como identificador de fuente.

Doctrina de "source-identifying function": El tribunal adopta la doctrina tradicional de que una marca debe "identify the source or origin" de bienes/servicios. Cita Jack Daniel's Props., Inc. v. VIP Prods. LLC (2023): "The first part of that definition, identifying the kind of things covered, is broad," but is cabined by the second part, which "describes every [mark's] 'primary' function: 'to identify... origin or ownership.'"

Aplicación a voces: El tribunal rechaza que la voz de Lehrman/Sage funcione como marca porque:

  1. Dualidad funcional: Las voces de profesionales de voz-over sirven simultáneamente como:

    • Identificadores de fuente (la voz como "marca" que distingue al actor A del B), Y
    • Servicios/productos en sí mismos (la voz es el bien vendido, no el identificador del vendedor).
  2. Falta de "secondary meaning": Las voces no han adquirido significado secundario como marcas. Lehrman y Sage son reconocidos por sus voces en contextos profesionales, pero ello no significa que esas voces hayan sido marcadas o registradas como identificadores de fuente de ningún producto específico suyo.

  3. Riesgo sistémico de expansión: Si se permitiera a cualquier artista reclamar protección Lanham Act contra voces similares, "would create a cause of action for, in effect, plagiarism," capaz de generar competencia desleal indebida.

Distinción de casos de celebrity endorsement: El tribunal reconoce que existen excepciones en casos donde la identidad personal (imagen, likeness) de una celebridad es usada sin consentimiento para implicar endorsement falso (ej. Facenda v. NFL Films, 3d Cir. 2008). Pero distingue que en esos casos:

  • Hay una identidad pública establecida (el atleta famoso es conocido por su cara/voz en ese contexto específico).
  • La apropiación ocurre en contexto de advertising o promoción directa.
  • El consumidor puede inferir razonablemente "endorsement".

En cambio, Lehrman y Sage:

  • No son celebridades en el sentido que sus voces sean inherentemente marcas en el mercado general.
  • Son profesionales que venden un servicio (grabar voces), no que venden su identidad personal.
  • El tribunal nota que declaran: "Plaintiffs are not paid only for their 'fame,' but also 'a negotiated and agreed-upon price for their professional services' based... on concrete vocal attributes like 'tone, quality, timbre, and delivery.'"

Conclusión: § 43(a)(1)(A) DESESTIMADO.


§ 43(a)(1)(B) — Publicidad Falsa:

Elemento clave: Falsedad literal o implícita sobre "naturaleza, características, cualidades u origen geográfico" de bienes/servicios.

Alegaciones de Plaintiffs:

  1. Lovo comercializaba los clones bajo nombres ficticios ("Kyle Snow", "Sally Coleman"), implícitamente sugiriendo que eran voces sintéticas originales, no clones.
  2. Lovo representaba que sus suscriptores recibían "full commercial rights" cuando, de hecho, carecían de autorización bajo NYCRL §§50-51.

Análisis del tribunal:

Respecto a (1): No hay falsedad. Lovo explícitamente marcaba los clones como "AI-driven synthetic voices" y enfatizaba su similitud como característica de venta ("cloned to near perfection"). Lehrman no alega que Lovo pretendiera vender voces reales; alega que las vendía como clones pero sin revelar su origen (que eran clones de sus voces específicas). Pero el Lanham Act § 43(a)(1)(B) no cubre esta clase de falsedad sobre "origen" o "autoría"; Dastar Corp. v. Twentieth Century Fox (2003) expresamente excluyó la "false assertion of license" o "false claim of authorship" del alcance de falsa publicidad.

Respecto a (2): Igualmente insuficiente. El tribunal aplica la doctrina post-Dastar: "courts have held [...] that the language of Section 43(a)(1)(B) excludes claims based on 'a false assertion of license' along with 'a false claim of authorship.'" Las promesas sobre "derechos comerciales" que Lovo hizo a sus suscriptores se refieren al status de licencia del producto, no a sus características materiales.

Fricción hermenéutica: El tribunal reconoce implícitamente que existe una "brecha": Lovo puede, legalmente bajo copyright y Lanham Act, comercializar a sus suscriptores un producto diciendo "tienes derechos comerciales completos," cuando de hecho los suscriptores enfrentarían responsabilidad civil bajo NYCRL si usan esos clones en ciertos contextos. Pero esa fricción no es reparable por Lanham Act; es reparable por la ley estatal de identidad y por el derecho de los competidores afectados (Plaintiffs).

Conclusión: § 43(a)(1)(B) DESESTIMADO.


2.3 New York Civil Rights Law §§ 50-51

Jerarquía: Primaria (derecho estatal de Nueva York, con rango de protección constitucional como regulación de derecho privado fundamental).

Texto clave (§50): "A person, firm or corporation, in this state, which uses for advertising purposes, or for the purposes of trade, the name, portrait, picture, likeness, or voice of any living person without having first obtained the written consent of such person [...] is guilty of a misdemeanor."

Elemento estructural: Cuatro requisitos:

  1. Uso of plaintiff's voice.
  2. Dentro del estado de New York.
  3. Para propósitos de publicidad o comercio.
  4. Sin consentimiento escrito.

Historia y propósito: La norma data de 1903, promulgada tras Roberson v. Rochester Folding Box Co., donde un fabricante usó la imagen de una mujer en publicidad de harina sin consentimiento. Diseñada como remedio contra la misappropriation de la identidad personal con fines comerciales, en ausencia de un derecho común de "privacy" en Nueva York.

Expansión jurisprudencial a tecnología digital:

  • Lohan v. Take-Two Interactive (31 N.Y.3d 111, 2018): La Corte de Apelaciones de Nueva York sostuvo que una "computer-generated image may constitute a 'portrait' within the meaning of [NYCRL §§50-51]." El tribunal amplió el concepto de "portrait" desde "fotografías reales" a "representaciones visuales digitales generadas por computadora."

  • Lehrman v. Lovo (2025): El tribunal extiende la lógica de Lohan a voces sintéticas. Razonamiento:

    "If anything, the Court views 'voice' as having a broader scope than a term like 'picture,' because it cannot plausibly be read to refer to any particular form of media or representative device."

    Y más fundamentalmente:

    "The statute is designed to protect a person's identity, not merely a property interest in his or her 'name', 'portrait' or 'picture.' [...] What matters is not whether, for example, a face is seen in a particular picture, but rather 'the quality and quantity of the identifiable characteristics displayed,' and whether they suffice to permit recognition of the plaintiff's identity."

Aplicación a hechos de Lehrman v. Lovo:

  1. Recognizability: Lehrman alega (con apoyo de declaraciones de profesionales de la industria vocal) que el clon "Kyle Snow" es "practically indistinguishable" de su voz. El tribunal acepta esta alegación en esta fase (motion to dismiss).

  2. Use in New York: Lovo's subscription service included voice clones, and "many of the consumers of Lovo's services [...] are located in New York." Lovo also posted marketing materials featuring the clones to its website and YouTube (nationwide but including NY users). El tribunal sostiene que esto satisface el requisito de "use in New York."

  3. Advertising or trade purposes: Lovo utilizó los clones en:

    • Presentaciones a inversores (Berkeley SkyDeck Demo Day, YouTube).
    • Artículos promocionales en su sitio web.
    • Tutoriales sobre cómo usar su software.
    • Como "voz por defecto" de su generador de síntesis.

    El tribunal concluye: "It is plausible to infer that, by illustrating the value of the product and helping show prospective customers how to use it, Lovo used its publicly posted tutorials to increase the appeal of its software, acquire subscribers, and retain subscribers it already had."

  4. Lack of written consent: Lehrman's and Sage's consent was obtained under false pretenses. They were told their voice recordings would be used for "research purposes only" (Lehrman) or "test scripts for radio ads" (Sage). NYCRL §50-51 does not require that the misrepresentation of purpose vitiate consent; rather, it prohibits use without "written consent." Pero implícitamente, el tribunal trata el consentimiento bajo pretensiones falsas como no válido porque no fue consentimiento al uso real.

Cuestión de estatuto de limitaciones (Statute of Limitations):

NYCRL §51 tiene límite de 1 año (N.Y. C.P.L.R. §215(3)). Pero el tribunal aplica la "single publication rule" con una excepción de "republication":

"Republication of the offending material refreshes the limitations period [...]. This 'occurs upon a separate aggregate publication from the original, on a different occasion, which is not merely 'a delayed circulation of the original edition.'"

Aplicación: Lehrman and Sage first heard their clones on the Deadline Strike Talk podcast on July 11, 2023. Before that, Lovo had publicado marketing materials featuring the clones, but the "key innovation" aquí es que:

"Unlike traditional Section 51 cases, the alleged misuse of Plaintiffs' voices did not involve a fixed recording, image, name, or other immutable device. [...] Here, Plaintiffs allege that the essence of their voices has been replicated, such that the Genny algorithm can and does continually produce entirely new sound clips using their voices, including well into the limitations period."

En otras palabras: cada vez que Genny genera una nueva síntesis usando el clon de Lehrman, es una nueva "publicación" del acto de misappropriation. Esto hace viable la excepción de republication.

Conclusión: NYCRL §§50-51 SURVIVEN motion to dismiss.


2.4 New York General Business Law §§ 349-350 (Consumer Protection)

Jerarquía: Primaria (derecho estatal).

Disposiciones:

  • § 349(a): Prohíbe "deceptive acts or practices" en comercio.
  • § 350: Prohíbe "false advertising."

Elementos requeridos: (1) consumer-oriented conduct, (2) materially misleading, (3) injury to plaintiff.

Teoría de Plaintiffs: Lovo misrepresentó a sus suscriptores que recibían "full commercial rights" para usar los voice clones sin restricciones legales. De facto, los suscriptores enfrentan responsabilidad bajo NYCRL §§50-51 si usan esos clones para ciertos propósitos comerciales sin consentimiento de Plaintiffs. Por lo tanto, el producto vendido vale menos de lo prometido.

Análisis del tribunal:

Diferencia con Lanham Act: GBL §§349-350 no requieren que la falsedad se refiera a "nature, characteristics, qualities, or geographic origin" del producto (como exige Lanham Act §43(a)(1)(B) bajo Dastar). En cambio, basta que la conducta sea "materially misleading" to a reasonable consumer.

Falsedad material: Lovo promised "full commercial rights"; de facto, esos "rights" bajo copyright federal son válidos, pero esos "rights" bajo NYCRL §§50-51 son nulos. Los consumidores de Lovo, al usar un clon sintético de Lehrman's voice, podrían ser demandados por Lehrman. Esto reduce el valor del producto.

Fricción crítica: El tribunal nota que los suscriptores de Lovo enfrentan riesgo de responsabilidad civil ("Lovo's subscribers could, like Lovo itself, be liable under Sections 50 and 51 of the NYCRL"). Lovo's representations ocultaban este riesgo.

Consumer-oriented conduct: A diferencia de Lanham Act, GBL cubre daño más amplio. Aquí, Lovo "offered a product to the public at large, and did so on misleading terms. That is the quintessential consumer-oriented harm that Sections 349 and 350 are designed to prevent."

Injury: Plaintiffs sufrieron daño competitivo: Lovo's voice clones, más baratos, desviaron clientes de Plaintiffs. Bajo casos como North State Autobahn v. Progressive, competidores dañados por conducta deceptiva dirigida al consumidor tienen standing para demandar.

Conclusión: GBL §§349-350 SURVIVEN motion to dismiss.


2.5 Contract Law (New York)

Requisitos: Offer, acceptance, consideration, mutual intent, assent.

Hechos: Lehrman y Sage aceptaron propuestas de trabajo via Fiverr chat messages. Los mensajes especificaban limitaciones de uso: "research purposes only" (Lehrman), "test scripts for radio ads" (Sage).

Defensa de Lovo — Statute of Frauds: Lovo argumentó que los contratos no podían ser ejecutables porque (a) no podían ser ejecutados en un año, (b) los mensajes de Fiverr no identificaban adecuadamente a las partes.

Refutación del tribunal:

  1. Identificación de partes: Aunque los agentes de Lovo usaron handles ("User25199087", "tomlsg"), ello no impide que Lovo esté vinculado. N.Y. Gen. Oblig. Law § 5-701(b)(4) permite que "any symbol" constituya firma si hay "present intent to authenticate." No se requiere nombre legal.

  2. Statute of Frauds compliance: El tribunal acepta que los Fiverr chats + Fiverr's Terms of Service satisfacen colectivamente el requisito de "written memorandum" bajo estatuto de fraudes.

  3. Material terms: Los chats describen (a) la naturaleza de la grabación, (b) el precio, (c) las restricciones de uso. Eso es suficiente.

Conclusión: Contract claims SURVIVEN motion to dismiss.


III. ANÁLISIS DOGMÁTICO Y TENSIONES NORMATIVAS

3.1 La Centralidad de la Ficción Jurídica de la "Voice as Mark"

La sentencia realiza un movimiento doctrinal sofisticado: rechaza la tesis de que la voz es una "marca" bajo Lanham Act, pero acepta implícitamente la tesis de que la voz es un "bien de identidad personal" protegible bajo NYCRL.

La tensión subyacente:

Si la voz fuera una "marca" (en el sentido Lanham Act), entonces:

  • Sería un "source identifier" cuya función primaria es distinguir al proveedor A del B.
  • Su protección estaría condicionada a "secondary meaning" (adquisición de significado como marca en el comercio).
  • Sería transferible.
  • Sería indefinidamente protegible (con renovaciones).

Pero esto no encaja con la realidad funcional de las voces de profesionales. Un voice-over actor no vende "su identidad como marca"; vende el servicio de leer scripts con su voz. Su voz es el medio, no el mensaje. El cliente compra la ejecución vocal para un propósito específico, no la voz como identidad de fuente del cliente.

Por el contrario, bajo NYCRL:

  • La voz es un atributo de identidad personal.
  • Su protección no requiere "secondary meaning"; requiere solo "recognizability".
  • No es transferible (solo el uso de la voz puede ser licenciado; la identidad del actor permanece vinculada).
  • Su protección es inherente a la persona.

Implicación doctrinal: El tribunal opera una reconfiguración tácita de categorías. Abandona el modelo de "voz como marca" y adopta el modelo de "voz como manifestación de identidad personal protegible bajo statutory right of publicity."

3.2 La Brecha en el Régimen de Copyright: § 114(b) como Laguna Estructural

El § 114(b) de la Copyright Act genera una contradicción jurídica fundamental:

Premisa 1: Lovo entrenó su modelo usando grabaciones de Lehrman sin consentimiento. Estos recordings son copyrighted works.

Premisa 2: § 114(b) dice que un nuevo sonido grabado que imita un sonido protegido no infringe, incluso si es indistinguible, si fue creado de forma independiente (esto es, sin copia).

Premisa 3: Lovo no copió los sonidos originales; extrajo características estadísticas y las reencarnó en nuevas síntesis.

Conclusión: No hay infracción de copyright, incluso aunque Lovo actuó sin consentimiento y comercializó el producto.

La paradoja: § 114(b) fue diseñado para proteger a músicos que hacen covers o a impersonadores que imitan voces famosas de forma manual/artesanal. No fue diseñado para AI voice cloning. Pero su lenguaje es lo suficientemente amplio para abarcar el cloning.

Fricción sistémica: El régimen de copyright no protege contra "uso no autorizado de voice data en training de modelos." Bajo la lógica actual, Lovo podría reclamar "fair use" para el training (aunque el tribunal señala que ello es abierto en futura litigación). La brecha es real.

¿Por qué el tribunal no expande copyright?

El tribunal argumenta (correctamente) que expandir copyright a "voces qua voces" violaría la arquitectura de copyright, que históricamente protege expresiones fijas, no características abstractas (como timbre, pitch, respiración). Hacerlo requeriría una reforma legislativa, no una reinterpretación judicial.

3.3 La Redefinición Pragmática de Consentimiento bajo NYCRL §50-51

Una fricción crítica: ¿qué significa "consentimiento escrito" cuando el consentimiento fue obtenido bajo pretensiones falsas?

Posición formal de Lovo: "Plaintiffs dieron consentimiento escrito (implícito en la aceptación de los términos de Fiverr). Punto. El estatuto no exige que el consentimiento no sea resultado de fraude."

Posición del tribunal (implícita):

"Lehrman's and Sage's consent was obtained under false pretenses. They were told their voice recordings would be used for 'research purposes only' (Lehrman) or 'test scripts for radio ads' (Sage). [... ] the chats can plausibly be read as evincing the parties' intent that Lovo would be able to use Plaintiffs' voice recordings only in narrowly circumscribed ways."

Innovación doctrinal: El tribunal trata el consentimiento como condicional sobre la veracidad de la representación de uso. Si el uso real diverge radicalmente de lo consentido, el consentimiento es viciado.

Esto es coherente con derecho de contratos (permiso fraudulento es nulo), pero introduce una presunción de vinculación entre consentimiento y propósito declarado en el contexto de NYCRL §50-51 que el texto estatutario no explícita.

Implicación: El tribunal está reformulando NYCRL §50 para leerla como: "uso sin consentimiento [válido y no fraudulentamente obtenido]."

3.4 Republication como Herramienta de Extensión del Statuto de Limitaciones

La norma de "single publication" dice que un acto continuo de publicación (ej., un artículo en periódico que circula días o semanas) solo inicia el reloj una vez. Pero el tribunal extiende esto al voice cloning:

"Here, Plaintiffs allege that the essence of their voices has been replicated, such that the Genny algorithm can and does continually produce entirely new sound clips using their voices, including well into the limitations period."

Interpretación: Cada nueva síntesis es una nueva "publicación" del acto de misappropriation. Por lo tanto, la republication exception aplica.

Fricción hermenéutica: La "publicación" bajo NYCRL §50-51 traditionally se refiere a distribución de una representación fija (fotografía en periódico, imagen en póster). ¿Puede hablarse de "publicación" cuando la síntesis es algorítmica y continua, no discreta?

El tribunal dice , pero bajo una lectura moderna: "publicación" = "acto de poner a disposición del público para propósitos de comercio." Si Lovo mantiene el clon en su software y permite que clientes lo descarguen, eso es acto continuo de publicación.

Riesgo: Esta expansión podría vulgarizar el límite temporal de NYCRL §51. Podría argumentarse que cualquier trabajo mantenido en línea (como un blog, foto en redes) es "continuamente publicado" y por lo tanto el estatuto nunca expira. El tribunal intenta limitar este riesgo diciendo que la exception aplica solo cuando hay "separate aggregate publication from the original, on a different occasion."

3.5 El Rechazo a Expandir GBL §§349-350 a Daño Privado Puro

Una tensión no resuelta: ¿debería Plaintiffs tener standing para demandar bajo GBL si la conducta deceptiva fue dirigida a los suscriptores de Lovo, no a Plaintiffs?

Doctrina tradicional: GBL §349 se aplica a daño competitivo solo si la conducta es dirigida al "consumer-oriented" públic y perjudica a competidores. Pero requiere que el daño sea "broader impact on consumers at large," no solo perjuicio privado.

Aplicación del tribunal: Acepta que los suscriptores de Lovo forman una clase de "consumers at large," y que Lovo's misrepresentations sobre "full commercial rights" los afecta. Por lo tanto, Plaintiffs, como competidores en el mercado de voz-over, tienen standing para demandar basado en el daño competitivo.

Innovación: Esto amplía el concepto de "consumer-oriented conduct." Tradicionalmente significaba "directed at consumers." Aquí el tribunal lee como "conduct that affects the consumer transaction and market between [defendant and consumers]."


IV. IMPLICACIONES SISTÉMICAS Y RIESGOS ESTRUCTURALES

4.1 Fragmentación Regulatoria: El Problema de la "Jurisdicción Checkerboard"

La sentencia se aplica solo a New York (bajo NYCRL). Lovo opera globalmente. ¿Qué ocurre en California? ¿Texas? ¿Otras jurisdicciones?

California Civil Code § 3344 (Right of Publicity): Prohíbe el uso de "nombre, voz, firma, fotografía, o similitud" sin consentimiento incluso después de la muerte. Es análogo a NYCRL pero más amplio (cubre personas fallecidas). El tribunal no analiza California law.

Riesgo sistémico: AI voice cloning companies enfrentarán un mosaico de protecciones estatales inconsistentes. Lovo puede cambiar su negocio para operar desde una jurisdicción con protecciones débiles contra voice cloning.

Implicación para regulación federal/global: La ausencia de un estándar federal o europeo crea incentivos de regulatory arbitrage. El AI Act europeo no cubre específicamente voice cloning, pero sus disposiciones sobre "high-risk AI systems" (art. 6-8) podrían ser invocadas si voice cloning se clasifica como "manipulated media" con potencial para causar daño.

4.2 Redefinición Implícita de "Training Data Rights"

La sentencia implícitamente toma posición sobre qué derechos tiene una persona sobre datos que la incluyen (en este caso, voice recordings):

Tesis implícita del tribunal:

  • Propiedad legal: El grabador (voice actor) retiene copyright sobre la grabación.
  • Derechos de identidad: El hablante retiene derechos de identidad (ability to prohibit uso no consentido para fines comerciales) incluso si renuncia a algunos derechos de copyright.
  • Uso para training: Usar la grabación para entrenar un modelo generativo es uso "no autorizado" bajo el contrato si el contrato no lo autoriza explícitamente.

Fricción: ¿Qué sucede si Plaintiffs hubieran sido pagados "work for hire"? ¿Hubieran perdido derechos de identidad también?

El tribunal no aborda esto, pero implícitamente sugiere que los derechos de identidad son inalienables (no transferibles), diferentes de copyright.

Resonancia con AI Act europeo: El AI Act (2024) Considerando (77) dice: "[Los] datos personales [...] utilizados para entrenar, validar, o probar modelos [...] deben cumplir con RGPD." El tribunal en Lehrman está argumentando algo similar: los datos de voz retienen un "derecho de identidad" separado de copyright.

4.3 El Problema de la Intención Maliciosa vs. Mera Copia

La sentencia no requiere que Lovo hubiera actuado con "mala fe" o intención maliciosa para ser responsable bajo NYCRL §50-51. El estatuto es liability sin culpa (strict liability de facto).

Consecuencia: Incluso una empresa que genuinamente creyera (equivocadamente) que tenía derecho a usar voice recordings para training, sería responsable si no obtuvo "consentimiento escrito" explícito.

Riesgo sistémico: Esto crea incentivos perversos. Una startup de AI, sin recursos para investigación legal exhaustiva, que ingenuamente use publicly available voice recordings para training, podría ser demandada bajo NYCRL §50-51 en Nueva York.

Pregunta abierta: ¿Debería NYCRL incluir una excepción de "fair use" o "good faith use"? La sentencia no lo contempla.

4.4 El Futuro del Fair Use en AI Training

El tribunal menciona "fair use" respecto de copyright claims (footnote 19):

"Lovo asserts, in one conclusory sentence, a defense of fair use. [...] Fair use is an affirmative defense on which Lovo bears the burden. [...] Relevant factors include the purpose and character of the work, its nature, and the effects of the allegedly infringing conduct on the relevant market. [...] However, that is not to say as a substantive matter that there is no fair use here. Cf. Bartz v. Anthropic PBC, No. 24-CV-5417, 2025 WL 1741691, at *5 (N.D. Cal. June 23, 2025) ('[T]he use of the books at issue to train Claude and its precursors was exceedingly transformative and was a fair use under Section 107 of the Copyright Act.')."

Implicación: El tribunal deja abierta la posibilidad de que Lovo argumente fair use en futuro litigio sobre copyright claims regarding training. Esto es importante: distingue entre (a) copyright infringement from training (donde fair use podría operar) y (b) NYCRL §50-51 misappropriation (donde fair use no es defensa tipificada).

Fricción doctrinal: No está claro si fair use puede operar como defensa a NYCRL §50-51. La sentencia no lo aborda. Posibles posiciones:

  • Posición restrictiva: NYCRL §50-51 es ley estatal de privacidad/identidad; fair use es doctrina copyright federal. No aplica.
  • Posición intermedia: Fair use principles podrían informar una defensa de "reasonable use" bajo NYCRL, pero no son concluyentes.
  • Posición expansiva: Fair use debería aplicar como defensa a NYCRL por analogía.

El tribunal en Lehrman no decide esto, pero la cuestión es crucial para futuros casos.


V. PROPUESTA DOCTRINAL: LA VOZ COMO BIEN DE IDENTIDAD PERSONAL DISTINTO DE MARCA Y OBRA PROTEGIDA

5.1 Reconfiguración de Categorías

Propongo que la sentencia Lehrman v. Lovo puede entenderse como estableciendo una tercera categoría jurídica de protección de voz, distinta de copyright y trademark:

CATEGORÍA 1: VOICE AS COPYRIGHTED SOUND RECORDING

  • Objeto: La grabación física/digital fija de sonido.
  • Régimen: Copyright Act §§ 102-114.
  • Protección: Derechos de reproducción, derivación, distribución.
  • Brecha: § 114(b) excluye imitaciones independientes.
  • Ejemplo: Lovo usando clip literal de Sage en presentación a inversores.

CATEGORÍA 2: VOICE AS TRADEMARK/SOURCE IDENTIFIER

  • Objeto: La voz como marca comercial.
  • Régimen: Lanham Act §43(a)(1)(A).
  • Protección: Contra confusión de consumidor sobre fuente/endorsement.
  • Requisito: Secondary meaning, source-identifying function.
  • Aplicabilidad limitada: Solo si voz es funcionalmente marca (rara en voice-over).

CATEGORÍA 3: VOICE AS IDENTITY MARKER (PERSONALITY ATTRIBUTE)

  • Objeto: La voz como manifestación inescindible de la identidad/personalidad del individuo.
  • Régimen: NYCRL §§ 50-51 (y análogos en otros estados).
  • Protección: Contra misappropriation para propósitos comerciales sin consentimiento.
  • Requisito: Recognizability, uso comercial, falta de consentimiento válido.
  • Aplicabilidad: Amplia para actores de voz, cantantes, personalidades públicas.

Mapeo de Lehrman v. Lovo:

ReclamaciónCategoríaResultado
Reproducción de grabación de Sage en presentación1 (Copyright)Parcialmente viable (dentro de 3 años)
Clon sintético de Lehrman como "Kyle Snow"2 (Trademark)RECHAZADO (no hay mark)
Clon sintético de Lehrman bajo NYCRL3 (Identity)VIABLE
Falsa publicidad sobre "derechos comerciales"GBL §349VIABLE (porque los "derechos" son falsos bajo NYCRL)

5.2 La Voz como Bien Intransmisible

Dentro de la Categoría 3, proponemos que la voz tiene un atributo distintivo: es inalienable (intransmisible).

Razón jurídica: Siguiendo a Rothman (2022), citada por el tribunal:

"Marks rooted in something distinct from oneself are quite different from those in which the signifying mark and the signified object merge, as is the case when what is signified is a particular person, rather than some external and distinct object or company."

La voz no puede separarse del individuo. Es parte de su identidad. Por lo tanto:

  • No puede ser cedida completamente. Un actor puede licenciar el uso de su voz para un propósito específico, pero no puede enajenar su derecho a impedir usos futuros no previstos.
  • No puede ser transferida por herencia. A diferencia de copyright (que sí se transmite hereditariamente), los derechos de identidad bajo NYCRL §50-51 terminan a la muerte del individuo (aunque §50-f amplía a "digital replicas" de personas fallecidas, es excepción).
  • No puede ser registrada como marca. El tribunal nota: "personal marks generally cannot be registered, and the law is highly skeptical of efforts to restrict individuals from using their own identities in trade."

Implicación: Incluso si Lehrman hubiera aceptado explícitamente un "work for hire" donde renuncia a derechos de copyright, sus derechos de identidad bajo NYCRL §50-51 serían inseparables de su persona.

5.3 El Consenso Condicional como Filtro de Validez

Propongo una doctrina de "conditional consent" para NYCRL §50-51 cases:

El consentimiento para usar la voz de una persona debe ser:

  1. Escrito (requisito estatutario).
  2. Específico en propósito (implícito en la ratio legis de protección de identidad).
  3. Válido (no obtenido bajo fraude o misrepresentación material sobre el propósito).

En Lehrman v. Lovo:

  • Lehrman consintió uso para "research purposes only" e "internal" y "academic" use.
  • Sage consintió uso para "test scripts for radio ads" que sería "only consumed internally."
  • Uso real: entrenamiento de modelo comercial, síntesis para distribución a miles de clientes, marketing.

Estas usos son tan divergentes del uso consentido que violan el consentimiento. No es cuestión de "slight deviation"; es abuso fundamental del propósito.

Defensa de la doctrina:

  • Requiere especificidad contractual, incentivando documentación clara.
  • No invalida consentimiento genuinamente amplio ("autorizo cualquier uso comercial de mi voz").
  • Es coherente con derecho de contratos (consentimiento bajo fraude es nulo).
  • Protege contra "mission creep" de datos personales en era AI.

VI. CUESTIONES ABIERTAS Y PUNTOS DE VULNERABILIDAD

6.1 Fair Use como Defensa a NYCRL §50-51

Pregunta: ¿Puede un artista reclamar "fair use" (editorial, satírica, educativa) respecto de NYCRL §50-51?

Ejemplo: Una radio station produciendo una parodia política que imita la voz de un locutor famoso sin consentimiento. ¿Es NYCRL §50-51 una defensa?

Posición del tribunal en Lehrman: No abordado. El tribunal solo menciona fair use como defensa potencial a copyright claims, no a NYCRL claims.

Riesgo: Si NYCRL §50-51 es strict liability sin fair use exception, sería incompatible con First Amendment en contextos de speech protegida.

Posible resolución: Los tribunales podrían leer implícitamente una excepción de "newsworthy use" o "fair use" en NYCRL §50-51, análoga a cómo han limitado las leyes de derecho de publicidad en contextos de speech.

6.2 Training Data vs. Output: La Brecha Permanente

Pregunta: ¿Si una empresa puede legalmente entrenar un modelo con voice recordings sin consentimiento (bajo copyright fair use), pero luego no puede distribuir el output (bajo NYCRL §50-51), ¿dónde se traza la línea?**

Escenario 1: Lovo entrena su modelo usando voice clips pero nunca comercializa los clones resultantes. ¿Viola NYCRL §50-51?

  • Respuesta probable: No, porque no hay "use" comercial del clon.

Escenario 2: Lovo entrena su modelo y comercializa clones, pero bajo un "modelo de consenso" donde each voice actor opta por participar.

  • Respuesta probable: Sí es legal si el opt-in es genuino y revocable.

Escenario 3: Lovo genera clones usando training data pero no los etiqueta como "clones de voces reales" sino como "synthetic voices."

  • Respuesta probable: Aún así viable bajo NYCRL §50-51 si los clones son reconocibles.

Brecha abierta: El tribunal no define con claridad dónde training se vuelve uso "comercial" prohibido. ¿Es comercial el training si el modelo será vendido? ¿Y si es gratis pero monetizado indirectamente (ads, databroking)?

6.3 Global Scope del Negocio Lovo vs. Jurisdicción Limitada de NYCRL

Pregunta: Lovo opera globalmente. Un voice-over actor español cuya voz fuera clonada por Lovo, ¿podría demandar bajo NYCRL §50-51?

Respuesta: Solo si hay "use in New York" (requisito estatutario). Para un cliente en Madrid usando clon en España, probablemente no habría NYCRL violation.

Riesgo sistémico: Lovo podría reorganizar su negocio para minimizar nexus con New York, reduciendo exposición a NYCRL.

Solución: Reforma federal de "right of publicity" estatutaria, o interpretación amplia de "use in New York" para incluir conducta dirigida a NY residents incluso si output es usado fuera de NY.

6.4 AI Act Europeo: Compatibilidad Doctrinal

Pregunta: ¿Cómo se alinea la doctrina de Lehrman v. Lovo con el AI Act europeo?**

AI Act Considerando 77:

"El tratamiento de datos personales para fines de entrenar, validar o probar sistemas de IA de alto riesgo debe estar en conformidad con el Reglamento (UE) 2016/679 (RGPD)."

AI Act Artículo 5(2)(c): Sistemas de IA usados para fines de evaluación del comportamiento humano deben informar a la persona sobre el sistema.

Análisis:

  • El entrenamiento de Lovo usando voice clips de Lehrman sin consentimiento probablemente violaría RGPD Artículo 6 (base legal para procesamiento) y Artículo 21 (derecho de oposición).
  • El output (clones sintéticos) podría ser clasificado como "manipulated media" bajo AI Act si representa a una persona identificable.
  • La Unión Europea desarrollaría una protección más robusta que NYCRL, basada en RGPD + AI Act.

Fricción: EE.UU. (bajo Lehrman) protege mediante NYCRL §50-51 (right of publicity estatutario). UE protege mediante RGPD + AI Act (data rights + system governance). Dos paradigmas diferentes.


VII. CONCLUSIÓN DOCTRINAL

7.1 Síntesis de la Sentencia

Lehrman v. Lovo, Inc. representa un hito en la jurisprudencia de tecnología e identidad personal. El tribunal realiza tres movimientos doctrinales críticos:

MOVIMIENTO 1: Rechazo de Expansión de Copyright El tribunal rechaza expandir el Copyright Act a voces "qua voces" como categoría protegible. Mantiene la distinción entre "expresión fija" (protegida por copyright) y "rasgo de identidad" (no protegible por copyright pero protegible por statute de publicidad). Esta posición es correcta. Expandir copyright requeriría reforma legislativa, no reinterpretación judicial.

MOVIMIENTO 2: Rechazo de Trademark/Lanham Act El tribunal distingue entre "voice as source identifier" (potentially trademark) y "voice as professional service" (not trademark). Para actores de voz, sus voces funcionan primariamente como servicios, no como marcas. No alcanzan "secondary meaning." La distinción es fina pero defendible.

MOVIMIENTO 3: Reconfiguración bajo NYCRL §50-51 El tribunal extiende NYCRL §50-51, una norma de 1903 diseñada para fotografías y imágenes, a voice clones sintéticos. La reconfiguración es pragmática: si la ley protege "portrait" digital (Lohan v. Take-Two, 2018), ¿por qué no "voice" sintética? El argumento es sólido.

7.2 Contribución Doctrinal

La sentencia contribuye tres concepciones jurídicas:

1. Voice as Inalienable Identity Attribute A diferencia de otros bienes intelectuales (copyright, trademark), la voz retiene un núcleo de inalienabilidad. Puede ser licenciada condicionalmente, pero no enajenada completamente.

2. Conditional Consent Doctrine El consentimiento para usar la voz debe ser específico en propósito. Consentimiento obtenido bajo misrepresentación material es viciado. Esto es innovación respecto de NYCRL, cuyo texto no requiere especificidad.

3. Republication Exception to Statute of Limitations En contexto de voice cloning, cada nueva síntesis es nueva "publicación" bajo NYCRL §50-51. Esto extiende el período de responsabilidad más allá del año estatutario, siempre que Lovo continúe ofreciendo los clones.

7.3 Implicaciones Estructurales para Derecho de la IA

Para AI Act europeo: La sentencia sugiere que voice cloning sin consentimiento viola "respect for human autonomy" (AI Act Considerando 1). Aunque el AI Act no cubre NYCRL §50-51, la lógica subyacente es convergente: los sistemas generativos que replican identidades personales requieren consentimiento informado y explícito.

Para regulación de training data: La sentencia implícitamente establece que "usar datos personales sin consentimiento para entrenar modelos" es un riesgo de responsabilidad separable de copyright infringement. Esto es importante para casos futuros en contexto de generative AI (text, image, audio).

Para derechos de identidad digital: La sentencia reconoce que la identidad (incluyendo voz) retiene protección bajo modernos regímenes de "data rights" y "identity rights," separable de copyright.

7.4 Cuestiones Abiertas para Futuro Litigio

  1. Fair use como defensa a NYCRL §50-51: ¿Será aplicable?
  2. Global enforcement: ¿Cómo se aplica NYCRL fuera de New York?
  3. Opt-in vs. Licensing: ¿Cuál es el modelo comercial viable para voice cloning?
  4. Comparación UE vs. USA: ¿RGPD + AI Act ofrecen protección superior?

7.5 Mensaje Normativo Final

La sentencia envía un mensaje claro a la industria de AI: no basta con afirmar que los voice clones son "synthetic" si incorporan rasgos identificables de personas específicas sin consentimiento. La ley estatal protege la identidad personal, incluida la voz, de forma que el derecho federal de autor no cubre.

En esta encrucijada entre innovación tecnológica e identidad personal, Lehrman v. Lovo opta por una posición cautelosa pero no obstrusiva: permite que Lovo continúe operando (no se prohíbe voice cloning per se), pero requiere consentimiento válido y específico. Es un equilibrio pragmático, adecuado a la fase actual de maduración del mercado de AI voice synthesis.


REFERENCIAS PRIMARIAS Y SECUNDARIAS

Jurisprudencia Federal (EE.UU.):

  • Dastar Corp. v. Twentieth Century Fox Film Corp., 539 U.S. 23 (2003).
  • Jack Daniel's Props., Inc. v. VIP Prods. LLC, 599 U.S. 140 (2023).
  • Lohan v. Take-Two Interactive Software, Inc., 31 N.Y.3d 111 (2018).
  • Facenda v. N.F.L. Films, Inc., 542 F.3d 1007 (3d Cir. 2008).
  • VMG Salsoul, LLC v. Ciccone, 824 F.3d 871 (9th Cir. 2016).
  • Bartz v. Anthropic PBC, No. 24-CV-5417, 2025 WL 1741691 (N.D. Cal. June 23, 2025).

Estatutos y Normativa:

  • United States Copyright Act, 17 U.S.C. § 102-114.
  • Lanham Act, 15 U.S.C. § 1125(a).
  • New York Civil Rights Law §§ 50-51.
  • New York General Business Law §§ 349-350.
  • EU Regulation on Artificial Intelligence (AI Act), 2024.
  • Regulation (EU) 2016/679 (GDPR).

Doctrina Académica:

  • Jennifer E. Rothman, Navigating the Identity Thicket: Trademark's Lost Theory of Personality, the Right of Publicity, and Preemption, 135 Harv. L. Rev. 1271 (2022).
  • McCarthy on Trademarks and Unfair Competition (5th ed. 2025).
  • Callmann on Unfair Competition, Trademarks and Monopolies (4th ed. 2024).

Fecha de análisis: Julio 2025
Sentencia: Lehrman v. Lovo, Inc., 24-CV-3770 (S.D.N.Y. 2025)
Juez: J. Paul Oetken