۱۷ خرداد ۲۵۸۵ · 8 دقیقه مطالعه
جنرالیست در برابر متخصص در عصر هوش مصنوعی ایجنتی
بیشتر دهه گذشته، توصیه شغلی تو حوزه تکنولوژی یه چیز ثابت بود: متخصص بشو. یه چیز سخت پیدا کن، برو توش عمیق، و صاحبش بشو. این توصیه اشتباه نبود؛ یه واکنش منطقی به بازاری بود که اون موقع وجود داشت.
معادله قدیمی
پنج یا شش سال پیش، وقتی به همکارام کمک میکردم تو این صنعت جا پیدا کنن، راهنمایی کموبیش یکسان بود، صرف نظر از تیم یا شرکت. اول اصول اولیه رو یاد بگیر (ساختار داده، شبکه، طراحی سیستم، اصول سیستمهای توزیعشده) و بعد یه حوزه انتخاب کن و بهش پایبند بمون. Kubernetes، Splunk، Spark، Terraform، هر چیزی که جذبت کرد. اصول اولیه کف بودن. تخصص سقف بود، و همین سقف بود که حقوقت رو تعیین میکرد و جایگزینناپذیرت میکرد.
این منطق زیر ذرهبین هم جواب میداد. یه متخصص چیزی میآورد که هیچکس دیگهای تو تیم اون عمق رو نداشت. وقتی cluster ساعت دو شب رفتار عجیبی میکرد، زنگ میزدی به آدم Kubernetes. وقتی alert سیستم SIEM میزد و هیچکس query رو نمیفهمید، زنگ میزدی به آدم Splunk. اون عمق دانش برای هر دو نفر، هم خود فرد هم تیم اطرافش، اهرم قدرت میساخت. آدمها نه فقط برای جواب، بلکه برای تعریف درست مسئله بهت تکیه میکردن.
استدلال جنرالیستها هم هیچوقت بیاساس نبود. دانش گسترده پیوند ایجاد میکنه. یه جنرالیست میتونه بین حوزهها پل بزنه، الگوها رو در سیستمهای مختلف ببینه، و جلساتی رو که به خاطر حرفزدن دو متخصص از کنار هم گیر کردن باز کنه. جنرالیستها معمولاً وقتی تکنولوژی عوض میشه سریعتر هم تطبیق پیدا میکنن، و تو تکنولوژی همیشه عوض میشه.
اما وقتی ماتریس کامل مزایا و معایب رو بررسی میکردی، متخصص معمولاً جلوتر میزد. عمق قابل دفاع بود. گستردگی، تو بازاری که روز به روز شلوغتر از آدمهای توانمند میشد، خیلی راحت قابل تکرار به نظر میرسید. هر کسی میتونست همون پستها و آموزشها رو بخونه. نه هر کسی میتونست ادعا کنه که سه سال تو خندقهای همون پلتفرم کار کرده.
من مدت طولانی تو اردوگاه متخصصان بودم. به این استدلال اعتقاد داشتم، این توصیه رو میدادم، و بیشتر دهه ۲۰۱۰ و اوایل ۲۰۲۰ دادهها هم تأیید میکردن.
بعد عصر ایجنتی رسید.
تغییر
ظهور مدلهای زبانی بزرگ محاسبات رو تدریجی تغییر داد، بعد یهدفعه. LLM های اولیه کنجکاویهای جالب بودن. میشد بهشون prompt داد، یه چیز معقول گرفت، و شاید به عنوان نقطه شروع ازشون استفاده کرد. اما در لبههای یه حوزه تخصصی به اندازه کافی غیرقابل اعتماد بودن که هنوز به متخصص نیاز داشتی تا همه چیز غیربدیهی رو تأیید کنه.
چیزی که تغییر کرد کف کیفیته. مدلهایی مثل خانواده Sonnet 4.x یا GPT-4o فقط «تو خیلی چیزا نسبتاً خوبن» نیستن. اونا در خیلی از حوزهها به اندازهای عمیقان که واقعاً میشه برای کارهایی بهشون تکیه کرد که قبلاً به یه متخصص باتجربه نیاز داشت. از یه مدل frontier بخوای یه Kubernetes admission webhook بنویسه، یه Byzantine consensus failure رو توضیح بده، یا یه Terraform module برای cross-account VPC peering بسازه: خروجی یه تقریب خشن نیست. هر چه بیشتر، چیزیه که یه مهندس شایسته افتخار میکرد که نوشته باشه.
اینجاست که معادله شروع میکنه به جیرجیر کردن. اگه یه ایجنت هوش مصنوعی همهمنظوره بتونه در طیف گستردهای از حوزهها در سطح نزدیک به متخصص کار کنه (همزمان، بدون خستگی، با هزینه چند سنت به ازای هر درخواست)، مزیت ساختاری تخصص انسانی چیه؟
جواب صادقانه اینه که این مزیت کوچیک میشه. نه به صفر، ولی کوچیک میشه.
یه لایه دوم هست که راحت از دستش میره. این مدلها فقط در انزوا توانمند نیستن. وقتی روی context engineering سرمایهگذاری میکنی (system prompt های دقیق، تعریفهای واضح از وظایف، حافظه کوریتشده و دسترسی به ابزار)، کیفیت مؤثر خروجیشون به طور قابل توجهی بالا میره. یه ایجنت هوش مصنوعی خوبسازماندهیشده با context مناسب میتونه خروجیای بده که از یه متخصص حوزه معمولی بدون اون داربست بیشتر باشه. این یه فرضیه نیست. امروز قابل مشاهدهست.
یه نقش جدید داره شکل میگیره
تو تقاطع همه اینا یه اتفاق جالب داره میافته. یه نوع نقش مهندسی جدید داره آروم آروم تو بازار شکل میگیره: Agentic AI Engineer.
این نه یه prompt engineerه، هرچند prompt engineering بخشی از مهارتهاست. نه یه ML engineer به معنای سنتیاش؛ تو مدلها رو train نمیکنی یا hyperparameter تنظیم نمیکنی. نه یه software engineer به معنای کلاسیکش هم هست، هرچند خیلی کد مینویسی.
Agentic AI Engineer سیستمهایی رو طراحی، میسازه و اداره میکنه که ایجنتهای هوش مصنوعی در اونا اجزای اول درجه هستن. تصمیم میگیره که ایجنتها چطور orchestrate بشن، به چه ابزارهایی دسترسی داشته باشن، حافظه و context چطور مدیریت بشه، لایه review انسانی چطور ساختاردهی بشه، و خطاها چطور تشخیص داده و برطرف بشن. ویژگیهای رفتاری LLM ها رو به اندازه کافی میفهمه که بتونه دورشون طراحی کنه: بدونه کِی به خروجی مدل اعتماد کنه، کِی یه مرحله اعتبارسنجی اضافه کنه، کِی یه کار رو به تکههای کوچیکتر تقسیم کنه، و کِی یه انسان رو دوباره وارد حلقه کنه.
این نقش نیاز داره که از طیف گستردهای از حوزهها به اندازه کافی بدونی که بتونی ایجنتهایی طراحی کنی که روی اونا کار کنن. شاید یه ایجنت برای infrastructure provisioning بسازی، بعد یکی برای code review، بعد یکی برای security auditing. هر کدوم از این حوزهها به اندازه کافی عمق دارن که یه جنرالیست خالص failure mode های مهم رو از دست بده. ولی هیچ متخصص تکحوزهای هم نمیتونه هر سه تا رو پوشش بده.
پس سؤال اینجا میرسه: برای این نقش خاص، شکل درست دانش چیه؟
معادله جدید
نظر من اینه که معادله وارونه میشه. یا دقیقتر بگم، تعادل جدیدی پیدا میکنه.
برای Agentic AI Engineer، یه پایه گسترده دانش حوزهای ارزشمندتره از عمق شدید تو یه حوزه تک. باید به اندازه کافی از Kubernetes بفهمی که بدونی وقتی ایجنت یه توصیه infrastructure میده منطقیه یا خطرناک. به اندازه کافی از security primitives سر دربیاری که بدونی IAM policy ای که ایجنت پیشنهاد داده بیش از حد باز نیست. به اندازه کافی از سیستمهای داده بفهمی که بدونی کِی ایجنت داره یه query optimization رو که وجود نداره hallucinate میکنه.
لازم نیست عمیقترین آدم تو اون اتاقها باشی. باید به اندازه کافی مسلط باشی که خروجی رو نقادانه بخونی و بفهمی کِی چیزی اشتباهه.
این یه واقعی معکوسشدنه. پروفایل پهنولیکمعمق جنرالیست، که تو بازار قدیم یه ضعف ساختاری بود، وقتی وظیفه اصلیات راهبری، ارزیابی و پذیرفتن مسئولیت خروجی سیستمهاییه که خودشون همزمان روی حوزههای زیادی کار میکنن، تبدیل به یه مزیت ساختاری میشه.
عمق متخصص بیارزش نمیشه. اصلاً. حوزههای پیچیده و پرخطر همچنان از متخصصان واقعی سود میبرن که میتونن failure mode هایی رو تشخیص بدن که نه یه مهندس جنرالیست نه یه مدل همهمنظوره تشخیص میده. ولی متخصصی که نتونه با سیستمهای AI-augmented کار کنه یا دربارهشون فکر کنه، میبینه که اهرم قدرتش داره کوچیک میشه. عمق باید با فهمیدن اینکه چطور اون رو از طریق ایجنتها تقویت کنی جفت بشه، نه اینکه صرفاً مستقیم ازش استفاده کنی.
یه بحث باز بدون جواب قطعی
راحت بود که اینجا با یه حکم قطعی تموم کنیم. ولی این یکی از اون بحثهاییه که به عنوان یه چارچوب ادامهدار مفیدتره تا سؤال بستهشده.
هم متخصص و هم جنرالیست امروز لازمن. ترکیب و تعادل همچنان تغییر میکنه، با بهتر شدن مدلها، رسیدن به بلوغ ابزارهای ایجنتی، و پیدا کردن تیمها برای درک تیزتر از اینکه کجا قضاوت انسانی جایگزینناپذیره و کجا گلوگاهه. موضع فرصتطلبانه (که هوش مصنوعی همه تخصص انسانی رو منسوخ میکنه و تنها مهارت مهم الان promptingه) یه موضع جدی نیست. این محتواست، نه تحلیل.
یه چیز هست که محکم بهش اعتقاد دارم و ارزش داره صریح بگمش: حتی وقتی یه ایجنت هوش مصنوعی یه تکه کد زیبا، درست و خوب تستشده مینویسه، باید یه انسان اون رو قبل از اینکه به نزدیکی production بره بررسی کنه. نه به این خاطر که ایجنت احتمالاً تو چیزهای بدیهی اشتباه میکنه (معمولاً نمیکنه)، بلکه به این خاطر که ایجنت هیچ سهمی از نتیجه نداره، هیچ فهمی از اینکه کد واقعاً چی اجرا میکنه نداره، و توانایی گرفتن دستههایی از خطا رو نداره که فقط ظاهر میشن وقتی کل context رو تو ذهنت نگه میداری و میپرسی آیا این چیز اصلاً باید وجود داشته باشه.
ایجنت یه همکار قدرتمنده. هنوز یه همکار مسئول نیست.
بیشتر درباره این تفاوت مینویسیم، خصوصاً درباره hallucination ها و خطرات سیستمهای ایجنتی بدون نظارت، تو یه پست آینده. این موضوع فضای خودش رو میخواد.
فعلاً: اگه یه متخصص هستی که داری فکر میکنی آیا باید گسترش پیدا کنی، جواب احتمالاً آرهست، و جهتش به سمت فهمیدنه که چطور با سیستمهای هوش مصنوعی کار کنی و دربارهشون استدلال کنی. اگه یه جنرالیست هستی که سالهاست بهت گفتن گستردگی یه ضعفه، شاید چند سال آینده مساعدتر از ده سال گذشته باشه. شکل مزیت تغییر کرده. نیاز به قضاوت انسانی نه.