۲۳ خرداد ۲۵۸۵ · 6 دقیقه مطالعه
Anthropic سه روز بعد از لانچ خاموش شد. این یعنی چی.
سه روز بعد از اینکه Anthropic، Fable 5 و Mythos 5 رو لانچ کرد، دولت ترامپ یه نامه از طرف Howard Lutnick وزیر بازرگانی به Dario Amodei فرستاد و مدلها برای همه مشتریها در همه جای دنیا خاموش شدن. نه فقط برای دولتهای خارجی. برای همه.
دلیل اعلام شده: یه شرکت دیگه ادعا کرد که تونسته Mythos 5 رو jailbreak کنه. Mythos 5 مدل تخصصی امنیت سایبری بود که فقط برای کاربران تأییدشده دولت آمریکا از طریق برنامهای به نام Project Glasswing در دسترس بود. همین ادعا برای وزارت بازرگانی کافی بود که کنترلهای صادراتی اعمال کنه و از Anthropic بخواد که هیچ شهروند خارجی به هر دو مدل دسترسی نداشته باشه. چون Anthropic از نظر فنی هیچ راهی برای تأیید تابعیت هر کاربر در زمان واقعی نداشت، “اجرای دستورالعمل” عملاً به معنای “کامل خاموش کردن همه چیز” بود.
این واقعیت ماجراست. این هم برداشت منه.
این قبلاً هم اتفاق افتاده
دهه ۱۹۹۰، دولت آمریکا رمزنگاری قوی رو به عنوان مهمات طبقهبندی کرد و سعی کرد صادرات اون رو با همون چارچوب قانونی تسلیحات کنترل کنه. Phil Zimmermann به خاطر اینکه PGP رو آنلاین به صورت رایگان در دسترس گذاشته بود مورد تحقیق قرار گرفت. محققان به خاطر انتشار مقالات رمزنگاری تهدید شدن. NSA، Clipper Chip رو پیش برد، یه backdoor سختافزاری که داخل تلفنها تعبیه میشد.
دولت اون جنگ رو باخت. نه به این خاطر که کوتاه اومد، بلکه چون ریاضیات مرز نمیشناسه. بعد از اینکه الگوریتمها منتشر شدن، همه جا بودن. کنترل صادرات رمزنگاری نه با یه رأی دادگاه، بلکه به خاطر عدم امکان اجرا در دنیای اینترنت جهانی فرو پاشید.
موازی کشیدن با هوش مصنوعی ناقصه، ولی شکل آشناست. چیزی که دولت سعی میکنه کنترل کنه، اطلاعاته، نه سختافزار. هفته گذشته تنها بیست و پنج مدل open-weight در همه مودالیتیها منتشر شد. درحالی که Fable 5 و Mythos 5 پشت یه مجوز وزارت بازرگانی قفل شدن، LFM2.5-8B شرکت Liquid AI روی لپتاپ اجرا میشه و وزنهای Ideogram 4 توسط هر کسی در سراسر کره زمین قابل دانلودن. قابلیتی که دولت ازش میترسه موجوده؛ فقط نامش Anthropic نیست.
تله ایمنی
یه طنز خاص در موقعیت Anthropic هست که ارزش نام بردن داره. Anthropic آزمایشگاه هوش مصنوعیایه که ایمنی رو هویت بنیادیش کرده. با مرکز استانداردها و نوآوری هوش مصنوعی در وزارت بازرگانی برای آزمایش قبل از استقرار همکاری کرده. Mythos 5 رو مخصوصاً برای مدافعان سایبری دولت آمریکا ساخته، زیر یه برنامه دسترسی محدود، با حفاظهای ایمنی برای جلوگیری از آسیب.
نتیجه: Anthropic الان همزمان هم روی یه لیست سیاه پنتاگون قرار داره که اون رو برای استفاده خود دولت خطرناک میدونه، و هم تحت کنترلهای صادراتی قرار داره که اون رو برای هر کسی خارج از آمریکا خطرناک تلقی میکنه. آزمایشگاهی که سختترین تلاش رو برای همکاری با دولت کرد، خاموش شد.
این به این معنا نیست که کار safety بیمعناست. ولی باید باعث بشه آزمایشگاههای دیگه با دقت درباره این فرض فکر کنن که همکاری تنظیممقررات، محافظت ایجاد میکنه. میتونه به همون اندازه آسیبپذیری ایجاد کنه. اگه سر میز بشینی و به دولت اجازه بدی مدلهات رو تحت یه توافق آزمایش قبل از استقرار تست کنه، همزمان بهش مکانیسمی میدی که وقتی چیزی پیدا کرد که دوست نداره عمل کنه.
”Jailbreak” اینجا واقعاً یعنی چی
کلمه jailbreak تو این داستان خیلی کار میکنه و ارزش داره دقیق باشیم. jailbreak در این زمینه یعنی کسی راهی پیدا کرده که یه مدل رو وادار کنه خروجیهایی تولید کنه که طراحی شده بود از تولیدشون سر باز بزنه. این یه نگرانی امنیتی واقعیه. ولی مدل تهدید اهمیت زیادی داره.
استدلال دولت به نظر میرسه اینه که یه Mythos 5 که jailbreak شده میتونه به مخالفان مزیت معناداری بده. این یه ادعای قابل آزمایشه، و خود بیانیه Anthropic میگه تظاهرات “تعداد کمی از آسیبپذیریهای جزئی قبلاً شناختهشده” رو نشون داد. یه jailbreak محدود روی مدلی که از قبل هم فقط برای کاربران تأییدشده آمریکایی محدود بود، یه رده ریسک کاملاً متفاوت از یه دستورالعمل سنتز سلاح بیولوژیک که از طریق یه API به صورت آزادانه در دسترسه.
وزارت بازرگانی به نظر میرسه یه حادثه امنیتی تجاری رو مثل یه آسیبپذیری سیستم تسلیحاتی بررسی کرده. اینا دو چیز متفاوتن. مخلوط کردنشون سیاستی ایجاد میکنه که به کاربران واقعی آسیب واقعی میرسونه، بدون اینکه ریسک واقعی رو به طور معناداری کاهش بده، چون قابلیت اساسی از طریق ابزارهای دیگه در دسترسه.
این یعنی چی اگه روی API های هوش مصنوعی میسازی
درس عملی صریحه: زمین میتونه شبانه جابهجا بشه. هفتاد و دو ساعت بعد از لانچ، بدون هیچ هشداری، همه مشتریها به صورت همزمان دسترسیشون به دو مدل از دست رفت. اگه محصولت به یه مدل خاص از یه ارائهدهنده واحد وابستهست، یه single point of failure داری که runbook های زیرساختت پوششش نمیده.
این مخصوص Anthropic نیست. هر مدل بستهای که به اندازه کافی پیشرفته باشه، تحت منطقی که اینجا اعمال شد، کاندیدای کنترل صادراتی هست. هر چه مدل قویتر، بیشتر شبیه یه دارایی امنیت ملی به نظر میرسه.
برای تیمهایی که روی API های هوش مصنوعی میسازن، سوال معماری دیگه فقط “کدوم مدل بهتره؟” نیست. سوال اینه که “اگه این مدل دیگه در دسترس نبود، fallback ما چیه؟” جواب بیشتر و بیشتر به سمت لایههای abstraction مدلآگنوستیک، routing چندین ارائهدهنده، و حداقل یه ظرفیت برای اجرای مدلهای open-weight به صورت محلی وقتی API خاموش میشه اشاره میکنه.
طنز اینه که اقدام دولت دقیقاً همون رفتاری که سعی داشت جلوگیری کنه رو تسریع کرد: کاربران پیشرفته رو به سمت گزینههای open-weight هل میده که هیچکس نمیتونه export-control کنه.
کجا میره
دولت میگه ممکنه تعلیق “در چند هفته آینده” رفع بشه وقتی که دستگاه امنیت ملی تقویت شه. Anthropic میگه این یه سوءتفاهمه و داره کار میکنه تا دسترسی رو بازگردونه. هر دو تا این جملهها ممکنه درست باشن.
ولی سابقه ایجاد شده. دولت آمریکا نشون داده که مدلهای پیشرفته هوش مصنوعی رو به عنوان فناوری تحت کنترل صادراتی در نظر میگیره، که یه ادعای jailbreak برای اقدام کافیه، و که تأثیر تجاری روی میلیونها کاربر یه شرط بلوکهکننده نیست.
اگه فکر میکنی این سابقه به Anthropic محدود میمونه، یا به دولت فعلی محدود میمونه، من روش شرط نمیبستم.
منبع: Axios — Scoop: Trump admin blocks foreign access to Anthropic’s most powerful AI