متا و کپی‌رایت

از برخی منبع های دارای کپی رایت برای آموزش هوش مصنوعی منفعت گیری کردیم


مدتی است که آموزش مدل‌های پیشرفته هوش مصنوعی با محتواهای اختصاصی به موضوعی او گفت و گو‌برانگیز تبدیل شده است. تعداد بسیاری از شرکت‌ها با شکایت‌هایی از سوی نویسندگان و رسانه‌های گوناگون روبه رو می باشند. اکنون متا اعتراف کرده که از کتاب‌های دارای کپی رایت در مجموعه‌ای موسوم به «Books3» منفعت گیری کرده است، بااین‌حال این شرکت تمایلی نیز به پرداخت غرامت به نویسندگان ندارد.

بر پایه گزارشی تازه، گروهی از نویسندگان با ادعای منفعت گیری غیرقانونی از مطالب دارای کپی رایت در گسترش مدل‌های زبان بزرگ Llama 1 و Llama 2، علیه متا شکایت کردند. در جواب، این شرکت به نویسنده و کمدین «سارا سیلورمن»، «ریچارد کادری» و دیگر دارندگان آثاری که کپی رایت دارند، حرف های است که مدل‌های هوش مصنوعی خود را با منفعت گیری از کتاب‌های دارای حق تکثیر آموزش داده است.

اعتراف متا و منفعت گیری منصفانه از منبع های دارای کپی رایت

متا اعتراف کرده است که از مجموعه Books3 برای آموزش مدل‌های زبانی بزرگ Llama 1 و Llama 2 منفعت گیری کرده است. Books3 مجموعه‌ای شناخته شده است که شامل متن ساده بیشتر از ۱۹۵ هزار کتاب است که مجموعاً نزدیک به ۳۷ گیگابایت حجم دارد. این آرشیو توسط یک محقق هوش مصنوعی در سال ۲۰۲۰ به‌گفتن راهی برای اراعه یک منبع داده بهتر برای بهبود الگوریتم‌های یادگیری ماشین تشکیل شد.

متا اکنون اذعان کرده است که از قسمت‌هایی از مجموعه داده Books3 منفعت گیری می‌کند؛ استدلال متا این است که منفعت گیری از آثار دارای کپی رایت برای آموزش مدل‌های هوش مصنوعی نیازی به رضایت یا پرداخت غرامت به نویسندگان ندارد. این شرکت ادعاهای مربوط به نقض حق تکثیر شاکیان را رد می‌کند و می‌گوید که هرگونه منفعت گیری از آثار دارای کپی رایت در Books3 باید به‌گفتن «منفعت گیری منصفانه» در نظر گرفته بشود. بدین معنی که شرکت‌ها می‌توانند بدون اجازه از مالک، از منبع های آن‌ها برای آموزش هوش مصنوعی منفعت گیری کنند.

OpenAI نیز در پی شکایت نیویورک تایمز، آشکارا اظهار کرده است که آموزش مدل‌های هوش مصنوعی بدون منفعت گیری از مطالب دارای کپی رایت غیرممکن است.



منبع