Anthropic سه روز بعد از لانچ خاموش شد. این یعنی چی.

سه روز بعد از اینکه Anthropic، Fable 5 و Mythos 5 رو لانچ کرد، دولت ترامپ یه نامه از طرف Howard Lutnick وزیر بازرگانی به Dario Amodei فرستاد و مدل‌ها برای همه مشتری‌ها در همه جای دنیا خاموش شدن. نه فقط برای دولت‌های خارجی. برای همه.

دلیل اعلام شده: یه شرکت دیگه ادعا کرد که تونسته Mythos 5 رو jailbreak کنه. Mythos 5 مدل تخصصی امنیت سایبری بود که فقط برای کاربران تأییدشده دولت آمریکا از طریق برنامه‌ای به نام Project Glasswing در دسترس بود. همین ادعا برای وزارت بازرگانی کافی بود که کنترل‌های صادراتی اعمال کنه و از Anthropic بخواد که هیچ شهروند خارجی به هر دو مدل دسترسی نداشته باشه. چون Anthropic از نظر فنی هیچ راهی برای تأیید تابعیت هر کاربر در زمان واقعی نداشت، “اجرای دستورالعمل” عملاً به معنای “کامل خاموش کردن همه چیز” بود.

این واقعیت ماجراست. این هم برداشت منه.

این قبلاً هم اتفاق افتاده

دهه ۱۹۹۰، دولت آمریکا رمزنگاری قوی رو به عنوان مهمات طبقه‌بندی کرد و سعی کرد صادرات اون رو با همون چارچوب قانونی تسلیحات کنترل کنه. Phil Zimmermann به خاطر اینکه PGP رو آنلاین به صورت رایگان در دسترس گذاشته بود مورد تحقیق قرار گرفت. محققان به خاطر انتشار مقالات رمزنگاری تهدید شدن. NSA، Clipper Chip رو پیش برد، یه backdoor سخت‌افزاری که داخل تلفن‌ها تعبیه می‌شد.

دولت اون جنگ رو باخت. نه به این خاطر که کوتاه اومد، بلکه چون ریاضیات مرز نمی‌شناسه. بعد از اینکه الگوریتم‌ها منتشر شدن، همه جا بودن. کنترل صادرات رمزنگاری نه با یه رأی دادگاه، بلکه به خاطر عدم امکان اجرا در دنیای اینترنت جهانی فرو پاشید.

موازی کشیدن با هوش مصنوعی ناقصه، ولی شکل آشناست. چیزی که دولت سعی می‌کنه کنترل کنه، اطلاعاته، نه سخت‌افزار. هفته گذشته تنها بیست و پنج مدل open-weight در همه مودالیتی‌ها منتشر شد. درحالی که Fable 5 و Mythos 5 پشت یه مجوز وزارت بازرگانی قفل شدن، LFM2.5-8B شرکت Liquid AI روی لپ‌تاپ اجرا می‌شه و وزن‌های Ideogram 4 توسط هر کسی در سراسر کره زمین قابل دانلودن. قابلیتی که دولت ازش می‌ترسه موجوده؛ فقط نامش Anthropic نیست.

تله ایمنی

یه طنز خاص در موقعیت Anthropic هست که ارزش نام بردن داره. Anthropic آزمایشگاه هوش مصنوعی‌ایه که ایمنی رو هویت بنیادیش کرده. با مرکز استانداردها و نوآوری هوش مصنوعی در وزارت بازرگانی برای آزمایش قبل از استقرار همکاری کرده. Mythos 5 رو مخصوصاً برای مدافعان سایبری دولت آمریکا ساخته، زیر یه برنامه دسترسی محدود، با حفاظ‌های ایمنی برای جلوگیری از آسیب.

نتیجه: Anthropic الان همزمان هم روی یه لیست سیاه پنتاگون قرار داره که اون رو برای استفاده خود دولت خطرناک می‌دونه، و هم تحت کنترل‌های صادراتی قرار داره که اون رو برای هر کسی خارج از آمریکا خطرناک تلقی می‌کنه. آزمایشگاهی که سخت‌ترین تلاش رو برای همکاری با دولت کرد، خاموش شد.

این به این معنا نیست که کار safety بی‌معناست. ولی باید باعث بشه آزمایشگاه‌های دیگه با دقت درباره این فرض فکر کنن که همکاری تنظیم‌مقررات، محافظت ایجاد می‌کنه. می‌تونه به همون اندازه آسیب‌پذیری ایجاد کنه. اگه سر میز بشینی و به دولت اجازه بدی مدل‌هات رو تحت یه توافق آزمایش قبل از استقرار تست کنه، همزمان بهش مکانیسمی می‌دی که وقتی چیزی پیدا کرد که دوست نداره عمل کنه.

”Jailbreak” اینجا واقعاً یعنی چی

کلمه jailbreak تو این داستان خیلی کار می‌کنه و ارزش داره دقیق باشیم. jailbreak در این زمینه یعنی کسی راهی پیدا کرده که یه مدل رو وادار کنه خروجی‌هایی تولید کنه که طراحی شده بود از تولیدشون سر باز بزنه. این یه نگرانی امنیتی واقعیه. ولی مدل تهدید اهمیت زیادی داره.

استدلال دولت به نظر می‌رسه اینه که یه Mythos 5 که jailbreak شده می‌تونه به مخالفان مزیت معناداری بده. این یه ادعای قابل آزمایشه، و خود بیانیه Anthropic می‌گه تظاهرات “تعداد کمی از آسیب‌پذیری‌های جزئی قبلاً شناخته‌شده” رو نشون داد. یه jailbreak محدود روی مدلی که از قبل هم فقط برای کاربران تأییدشده آمریکایی محدود بود، یه رده ریسک کاملاً متفاوت از یه دستورالعمل سنتز سلاح بیولوژیک که از طریق یه API به صورت آزادانه در دسترسه.

وزارت بازرگانی به نظر می‌رسه یه حادثه امنیتی تجاری رو مثل یه آسیب‌پذیری سیستم تسلیحاتی بررسی کرده. اینا دو چیز متفاوتن. مخلوط کردنشون سیاستی ایجاد می‌کنه که به کاربران واقعی آسیب واقعی می‌رسونه، بدون اینکه ریسک واقعی رو به طور معناداری کاهش بده، چون قابلیت اساسی از طریق ابزارهای دیگه در دسترسه.

این یعنی چی اگه روی API های هوش مصنوعی می‌سازی

درس عملی صریحه: زمین می‌تونه شبانه جابه‌جا بشه. هفتاد و دو ساعت بعد از لانچ، بدون هیچ هشداری، همه مشتری‌ها به صورت همزمان دسترسیشون به دو مدل از دست رفت. اگه محصولت به یه مدل خاص از یه ارائه‌دهنده واحد وابسته‌ست، یه single point of failure داری که runbook های زیرساختت پوششش نمی‌ده.

این مخصوص Anthropic نیست. هر مدل بسته‌ای که به اندازه کافی پیشرفته باشه، تحت منطقی که اینجا اعمال شد، کاندیدای کنترل صادراتی هست. هر چه مدل قوی‌تر، بیشتر شبیه یه دارایی امنیت ملی به نظر می‌رسه.

برای تیم‌هایی که روی API های هوش مصنوعی می‌سازن، سوال معماری دیگه فقط “کدوم مدل بهتره؟” نیست. سوال اینه که “اگه این مدل دیگه در دسترس نبود، fallback ما چیه؟” جواب بیشتر و بیشتر به سمت لایه‌های abstraction مدل‌آگنوستیک، routing چندین ارائه‌دهنده، و حداقل یه ظرفیت برای اجرای مدل‌های open-weight به صورت محلی وقتی API خاموش می‌شه اشاره می‌کنه.

طنز اینه که اقدام دولت دقیقاً همون رفتاری که سعی داشت جلوگیری کنه رو تسریع کرد: کاربران پیشرفته رو به سمت گزینه‌های open-weight هل می‌ده که هیچ‌کس نمی‌تونه export-control کنه.

کجا می‌ره

دولت می‌گه ممکنه تعلیق “در چند هفته آینده” رفع بشه وقتی که دستگاه امنیت ملی تقویت شه. Anthropic می‌گه این یه سوء‌تفاهمه و داره کار می‌کنه تا دسترسی رو بازگردونه. هر دو تا این جمله‌ها ممکنه درست باشن.

ولی سابقه ایجاد شده. دولت آمریکا نشون داده که مدل‌های پیشرفته هوش مصنوعی رو به عنوان فناوری تحت کنترل صادراتی در نظر می‌گیره، که یه ادعای jailbreak برای اقدام کافیه، و که تأثیر تجاری روی میلیون‌ها کاربر یه شرط بلوکه‌کننده نیست.

اگه فکر می‌کنی این سابقه به Anthropic محدود می‌مونه، یا به دولت فعلی محدود می‌مونه، من روش شرط نمی‌بستم.

منبع: Axios — Scoop: Trump admin blocks foreign access to Anthropic’s most powerful AI

Anthropic سه روز بعد از لانچ خاموش شد. این یعنی چی.

این قبلاً هم اتفاق افتاده

تله ایمنی

”Jailbreak” اینجا واقعاً یعنی چی

این یعنی چی اگه روی API های هوش مصنوعی می‌سازی

کجا می‌ره

مطالب مرتبط

گیت‌لب داره هسته‌اش رو برای عصر ایجنتی از نو می‌سازه. وقتش هم درسته.

جنرالیست در برابر متخصص در عصر هوش مصنوعی ایجنتی

بیست و پنج مدل open-weight در یه هفته. بررسی یه متخصص.