Reddit actualiza su política de contenido y ahora requiere un contrato para acceder a su información pública

Reddit está implementando una nueva política para equilibrar el deseo de licenciar su contenido a grandes empresas de tecnología y proteger la privacidad de los usuarios. La recién anunciada «Política de Contenido Público» se unirá a las políticas existentes de privacidad y contenido de Reddit para guiar cómo se accede y utiliza los datos de Reddit por entidades comerciales y otros socios. En relación con esto, la empresa también anunció un subreddit dedicado a los investigadores que trabajan con los datos de Reddit.

El anuncio llega poco después del debut en el mercado de valores de Reddit, lo que posiciona a la empresa para aumentar los ingresos no solo de los anuncios que se ejecutan en su plataforma y el uso de la API por parte de los desarrolladores, sino también de su corpus de datos. La empresa en su prospecto de la OPV dijo que ya había ganado $203 millones a través de acuerdos de licencia de datos y espera que esa cifra aumente con el tiempo.

Si bien Reddit había permitido el acceso a sus datos con fines de entrenamiento de inteligencia artificial, cambió su rumbo el año pasado. El CEO de Reddit, Steve Huffman, le dijo al New York Times que no tenía sentido que Reddit continuara brindando «todo ese valor a algunas de las empresas más grandes del mundo de forma gratuita», señalando el plan de la empresa para ingresar al espacio de licencia de datos.

Con esos esfuerzos ya en marcha, la nueva Política de Contenido Público limitará el acceso a los datos de Reddit sin un acuerdo. (Reddit dice que no está imponiendo nuevas restricciones, simplemente publicitando la política que ha tenido en vigor internamente desde hace algún tiempo).

«Desafortunadamente, vemos que cada vez más entidades comerciales utilizan acceso no autorizado o están abusando del acceso autorizado para recopilar datos públicos a granel, incluido el contenido público de Reddit», escribe Reddit en su blog. «Peor aún, estas entidades perciben que no tienen limitaciones sobre su uso de esos datos, y lo hacen sin tener en cuenta los derechos de los usuarios o la privacidad, ignorando solicitudes razonables de eliminación legal, de seguridad y de usuario. Si bien seguiremos nuestros esfuerzos para bloquear a los actores malos conocidos, necesitamos hacer más para restringir el acceso al contenido público de Reddit a escala para actores de confianza que hayan acordado cumplir con nuestras políticas. Pero también debemos seguir asegurándonos de que los usuarios, moderadores, investigadores y otros actores de buena fe y no comerciales tengan acceso».

En otras palabras, el acceso a los datos de Reddit para investigaciones y otros fines no comerciales continuará, pero las entidades que deseen utilizar los datos de Reddit con otros propósitos, incluido el entrenamiento de inteligencia artificial, tendrán que pagar. En un gráfico compartido en el blog, Reddit deja esto claro, diciendo que las empresas interesadas en usar los datos de Reddit para «alimentar, aumentar o mejorar su producto con cualquier propósito comercial» requiere un contrato.

Mientras tanto, los anunciantes son dirigidos a una API publicitaria para administrar campañas y rastrear su rendimiento.

Debido a que la empresa es esencialmente solo un gran sitio web, indexable por motores de búsqueda, esta nueva política tiene como objetivo asegurar el contenido de Reddit de cualquier recopilación no autorizada, al tiempo que respeta los derechos de los usuarios.

Por ejemplo, Reddit dice que sus socios tendrán que respetar las decisiones de los usuarios de eliminar su contenido. Entonces, si los usuarios no quieren que sus publicaciones personales sean material para futuras herramientas de inteligencia artificial, deberían poder optar por no participar. Los socios también están limitados por la nueva política para usar el contenido de Reddit para identificar a individuos o su información personal, incluido el enfoque de anuncios. Tampoco pueden usar el contenido de Reddit para enviar spam o acosar a sus usuarios o para realizar «verificaciones de antecedentes, reconocimiento facial, vigilancia gubernamental o ayudar a las fuerzas del orden a hacer cualquiera de estas acciones».

La política también restringe el acceso a medios para adultos y aclara que Reddit no venderá la información personal de sus usuarios. La empresa también señala que nunca licenciará contenido no público como mensajes privados o información de cuentas no pública, como correos electrónicos de los usuarios o historial de navegación, entre otras cosas.

Para ayudar a los investigadores que desean utilizar los datos de Reddit con fines no comerciales, la empresa ha establecido un nuevo subreddit, r/reddit4researchers. La empresa dice que se está asociando con OpenMined para desarrollar un programa para guiar y fomentar la colaboración de los investigadores con Reddit.

Vía TechCrunch