এটা TPU ত ফ্লেচ মনোযোগ জোৰ কৰা আৰু হাৰ্ড ৱে শিকিব পৰা | Mewayz Blog Skip to main content
Hacker News

এটা TPU ত ফ্লেচ মনোযোগ জোৰ কৰা আৰু হাৰ্ড ৱে শিকিব পৰা

মন্তব্য

1 min read Via archerzhang.me

Mewayz Team

Editorial Team

Hacker News
<শৰীৰ>

এটা TPU ত ফ্লেচ মনোযোগ জোৰ কৰা আৰু কঠিন পথ শিকিব পৰা

অনুকূলনৰ পিছত লগাটো অভিযন্তাৰ বাবে এটা চাইৰেন গীত। ই কেৱল বৃদ্ধি পোৱা লাভৰ প্ৰতিশ্ৰুতি দিয়ে, কিন্তু আপোনাৰ ইচ্ছা অনুসৰি হাৰ্ডৱেৰ বেঁকা কৰাৰ ৰোমাঞ্চৰ প্ৰতিশ্ৰুতি দিয়ে। মোৰ শেহতীয়া অডিচি এটা অত্যাধুনিক ফ্লেচ এটেনচন প্ৰণয়ন—এনভিডিয়া জিপিইউসমূহৰ বাবে ডিজাইন কৰা—এটা গুগল টিপিইউত বাধ্য কৰাবলৈ এই আকৰ্ষণৰ পৰাই জন্ম হৈছিল। লক্ষ্য আছিল উচ্চমানৰ: এটা জটিল অনুমান পাইপলাইন ত্বৰান্বিত কৰা। এই যাত্ৰা অৱশ্যে মডিউলাৰ চিষ্টেম ডিজাইনৰ কঠিন সত্যৰ মাষ্টাৰক্লাছ আছিল। প্ৰযুক্তিগত বৈষম্যক আকোৱালি লোৱা আৰু পৰিচালনা কৰা মেৱাইজৰ দৰে প্লেটফৰ্মসমূহ বহনক্ষম ব্যৱসায়িক কাৰ্য্যকলাপৰ বাবে কিয় অপৰিহাৰ্য সেই কথা আঙুলিয়াই দিয়া এটা কাহিনী।

শিখৰ প্ৰদৰ্শনৰ চাইৰেন গীত

ফ্লেচ এটেনচন হৈছে এটা বৈপ্লৱিক এলগৰিদম যি মেমৰি অভিগম অনুকূল কৰি ট্ৰেন্সফৰ্মাৰ মডেলসমূহক নাটকীয়ভাৱে দ্ৰুত কৰে। ইয়াক ডিজাইন কৰা GPU সমূহত, ই বিশুদ্ধ যাদু। আমাৰ মূল এপ্লিকেচন, এটা নথিপত্ৰ প্ৰচেছিং ইঞ্জিন, এই মডেলসমূহৰ ওপৰত বহু পৰিমাণে নিৰ্ভৰশীল। বেঞ্চমাৰ্ক সংখ্যাবোৰ দেখি সমীকৰণটো সহজ যেন লাগিল: ফ্লেচ এটেনচন + আমাৰ টিপিইউ কোটা = দ্ৰুত প্ৰচেছিং আৰু কম খৰচ। মই ডুব গ'লোঁ, নিশ্চিত যে যথেষ্ট নিম্ন-স্তৰৰ টিংকিংৰ সৈতে—কাৰ্নেল বিন্যাস, মেমৰি স্থান, আৰু XLA কমপাইলাৰৰ সৈতে মল্লযুঁজ কৰি—মই এই বৰ্গক্ষেত্ৰৰ পেগটোক এটা ঘূৰণীয়া, টেনছৰ-প্ৰচেছিং-আকৃতিৰ ফুটাত ফিট কৰিব পাৰিম। প্ৰাৰম্ভিকভাৱে কেৱল কাৰিকৰী বিজয়ৰ ওপৰত গুৰুত্ব দিয়া হৈছিল, ব্যৱস্থাটোৰ দীৰ্ঘম্যাদী হৃদস্পন্দনৰ ওপৰত নহয়।

অদৃশ্য জটিলতাৰ কেছকেড

প্ৰথম "সফলতা" আছিল মাদক। কেইবা সপ্তাহৰ পাছত চলাবলৈ মডেল এটা পালোঁ৷ কিন্তু জয় ফুটা আছিল। হেকটো ভংগুৰ আছিল, প্ৰতিটো সৰু সৰু লাইব্ৰেৰী আপডেটৰ লগে লগে ভাঙি গৈছিল। ইয়াতকৈও বেয়া কথাটো হ’ল, ই সমগ্ৰ পাইপলাইনটোত অদৃশ্য ড্ৰেগ সৃষ্টি কৰিছিল। বেচপক TPU ক'ড পথ এটা চাইলো হৈ পৰিল, আমাক পৃথক মোতায়েন স্ক্ৰিপ্ট, নিৰীক্ষণ হুক, আৰু আনকি ডাটা-লোডিং লজিক ৰক্ষণাবেক্ষণ কৰিবলৈ বাধ্য কৰালে। যিটো এটা অনুকূলিত মডিউল হ’ব বুলি কোৱা হৈছিল, সেয়া হৈ পৰিল এটা ভংগুৰ ক’লা বাকচ। আমি যন্ত্ৰণাদায়ক বিফলতা অনুভৱ কৰিলোঁ:

  • ডিবাগিং হেল: প্ৰামাণিক প্ৰফাইলিং সঁজুলিসমূহ আমাৰ স্বনিৰ্বাচিত কাৰ্ণেলৰ প্ৰতি অন্ধ আছিল, পৰিৱেশন ৰিগ্ৰেছনক নিদান কৰাটো এটা দুঃস্বপ্ন কৰি তুলিছিল।
  • দলৰ বটলনেক: কেৱল মইহে লেবিৰিন্থাইন ক'ডটো বুজি পাইছিলোঁ, যদি মই উপলব্ধ নহয় তেন্তে বিকাশ বন্ধ কৰি দিছিল।
  • সংহতি ঋণ: মূল মডেলৰ আপষ্ট্ৰিম উন্নয়নসমূহ আমাৰ ফ্ৰেংকেনষ্টাইন টিপিইউ ফৰ্কলৈ সহজে পৰ্ট কৰিব পৰা নগ'ল।
  • খৰচৰ স্পাইক: আমাৰ অগতানুগতিক মেমৰি ব্যৱস্থাপনাৰ পৰা জন্ম হোৱা টিপিইউত এটা ৰহস্যময় মেমৰি লিকে এবাৰ আমি ধৰাৰ আগতেই ৪০% খৰচ অতিক্ৰম কৰিছিল।

মডুলাৰ মানসিকতা: বল-ফিটিঙৰ ওপৰত সংহতি

মূল পাঠটো TPU বা মনোযোগ এলগৰিদমৰ বিষয়ে নাছিল। কথাটো আছিল মডুলাৰিটিৰ কথা। আমি এটা মৌলিক নীতি উলংঘা কৰিছিলোঁ: এটা ব্যৱস্থাৰ উপাদানসমূহ শ্বেপযোগ্য আৰু আন্তঃকাৰ্য্যক্ষম হ'ব লাগে, একেলগে ৱেল্ডিং কৰা নহয়। আমাৰ ষ্টেকত এটা অ-স্থানীয় উপাদান জোৰ কৰি, আমি এটা কাল্পনিক শিখৰ পৰিৱেশনৰ বাবে স্থিৰতা, স্পষ্টতা আৰু চঞ্চলতাক ত্যাগ কৰিলোঁ যিটো উৎপাদনত খুব কমেইহে উপলব্ধি কৰা হৈছিল। এইখিনিতে মেৱেজৰ দৰে মডিউলাৰ ব্যৱসায়িক অ’ এছৰ দৰ্শন গুৰুত্বপূৰ্ণ হৈ পৰে। মেৱাইজ আপোনাক এটা ষ্টেকত লক কৰা নহয়; ই অৰ্কেষ্ট্ৰেচন স্তৰ প্ৰদান কৰাৰ বিষয়ে যি আপোনাক কামৰ বাবে সৰ্বোত্তম সঁজুলি ব্যৱহাৰ কৰাৰ অনুমতি দিয়ে—সেয়া এটা GPU-নিৰ্দিষ্ট অনুকূলন হওক বা এটা TPU-স্থানীয় আৰ্হি হওক—নিজে সংযুক্ত কলা নিৰ্মাণ আৰু ৰক্ষণাবেক্ষণ নকৰাকৈ।

<ব্লককোট>

"প্ৰণালীবদ্ধ জটিলতা বৃদ্ধি কৰা অনুকূলন প্ৰায়ে অগ্ৰগতিৰ বেশত কেৱল ভৱিষ্যতৰ কাৰিকৰী ঋণ। প্ৰকৃত দক্ষতা পৰিষ্কাৰ আন্তঃপৃষ্ঠ আৰু সলনি কৰিব পৰা অংশৰ পৰা আহে, বীৰত্বপূৰ্ণ একক সংহতিৰ পৰা নহয়।"

ৰ দ্বাৰা

শিক্ষণ আৰু বহনক্ষম গতিলৈ পিভটিং

আমি শেষত বলপূৰ্বক Flash Attention পৰীক্ষাটো শ্বেলফত ৰাখিলোঁ। ইয়াৰ পৰিৱৰ্তে আমি এটা টিপিইউ-স্থানীয় মনোযোগ প্ৰণয়নলৈ পিভট কৰিলোঁ যিটো কাগজত তাত্ত্বিকভাৱে লেহেমীয়া হ'লেও বহুত বেছি নিৰ্ভৰযোগ্য আৰু ৰক্ষণাবেক্ষণযোগ্য বুলি প্ৰমাণিত হ'ল। ইয়াৰ স্থিৰতাৰ বাবেই সামগ্ৰিক ব্যৱস্থাৰ থ্ৰুপুট প্ৰকৃততে উন্নত হৈছিল। তাতোকৈ গুৰুত্বপূৰ্ণ কথাটো হ’ল, আমি আমাৰ এআই সেৱাসমূহক বিচ্ছিন্ন, সুনিৰ্দিষ্ট মডিউল হিচাপে স্থাপত্য কৰিবলৈ আৰম্ভ কৰিলোঁ। চিন্তাৰ এই পৰিৱৰ্তন—কেঁচা, স্থানীয়কৃত পৰিৱেশনৰ সলনি উপাদানসমূহৰ মাজত পৰিষ্কাৰ চুক্তিক অগ্ৰাধিকাৰ দিয়া—ঠিক সেইটোৱেই ব্যৱসায়সমূহক বুদ্ধিমানৰূপে স্কেল কৰিবলৈ অনুমতি দিয়ে। দ্ৰুতগতিত বিকশিত হোৱা হাৰ্ডৱেৰৰ জগতখনত, Mewayz ৰ দৰে এটা প্লেটফৰ্মে চকা পুনৰ নিৰ্মাণ নকৰাকৈ, বা আমাৰ ক্ষেত্ৰত, প্ৰচেছৰ পুনৰ উদ্ভাৱন কৰিবলৈ চেষ্টা নকৰাকৈ নতুন ক্ষমতাসমূহ প্লাগ ইন কৰাৰ কাঠামো প্ৰদান কৰে। কঠিন পথটোৱে আমাক শিকাইছিল যে বহনক্ষম গতি প্ৰতিটো মাইক্ৰ’-যুদ্ধত জয়ী হোৱাটো নহয়, বৰঞ্চ আপোনাৰ সমগ্ৰ সেনাই একেলগে মাৰ্চ কৰিব পৰাটো নিশ্চিত কৰাটোৱেই।

💡 DID YOU KNOW?

Mewayz replaces 8+ business tools in one platform

CRM · Invoicing · HR · Projects · Booking · eCommerce · POS · Analytics. Free forever plan available.

Start Free →

সঘনাই সোধা প্ৰশ্ন

এটা TPU ত ফ্লেচ মনোযোগ জোৰ কৰা আৰু কঠিন পথ শিকিব পৰা

অনুকূলনৰ পিছত লগাটো অভিযন্তাৰ বাবে এটা চাইৰেন গীত। ই কেৱল বৃদ্ধি পোৱা লাভৰ প্ৰতিশ্ৰুতি দিয়ে, কিন্তু আপোনাৰ ইচ্ছা অনুসৰি হাৰ্ডৱেৰ বেঁকা কৰাৰ ৰোমাঞ্চৰ প্ৰতিশ্ৰুতি দিয়ে। মোৰ শেহতীয়া অডিচি এটা অত্যাধুনিক ফ্লেচ এটেনচন প্ৰণয়ন—এনভিডিয়া জিপিইউসমূহৰ বাবে ডিজাইন কৰা—এটা গুগল টিপিইউত বাধ্য কৰাবলৈ এই আকৰ্ষণৰ পৰাই জন্ম হৈছিল। লক্ষ্য আছিল উচ্চমানৰ: এটা জটিল অনুমান পাইপলাইন ত্বৰান্বিত কৰা। এই যাত্ৰা অৱশ্যে মডিউলাৰ চিষ্টেম ডিজাইনৰ কঠিন সত্যৰ মাষ্টাৰক্লাছ আছিল। প্ৰযুক্তিগত বৈষম্যক আকোৱালি লোৱা আৰু পৰিচালনা কৰা মেৱাইজৰ দৰে প্লেটফৰ্মসমূহ বহনক্ষম ব্যৱসায়িক কাৰ্য্যকলাপৰ বাবে কিয় অপৰিহাৰ্য সেই কথা আঙুলিয়াই দিয়া এটা কাহিনী।

শিখৰ প্ৰদৰ্শনৰ চাইৰেন গীত

ফ্লেচ এটেনচন হৈছে এটা বৈপ্লৱিক এলগৰিদম যি মেমৰি অভিগম অনুকূল কৰি ট্ৰেন্সফৰ্মাৰ মডেলসমূহক নাটকীয়ভাৱে দ্ৰুত কৰে। ইয়াক ডিজাইন কৰা GPU সমূহত, ই বিশুদ্ধ যাদু। আমাৰ মূল এপ্লিকেচন, এটা নথিপত্ৰ প্ৰচেছিং ইঞ্জিন, এই মডেলসমূহৰ ওপৰত বহু পৰিমাণে নিৰ্ভৰশীল। বেঞ্চমাৰ্ক সংখ্যাবোৰ দেখি সমীকৰণটো সহজ যেন লাগিল: ফ্লেচ এটেনচন + আমাৰ টিপিইউ কোটা = দ্ৰুত প্ৰচেছিং আৰু কম খৰচ। মই ডুব গ'লোঁ, নিশ্চিত যে যথেষ্ট নিম্ন-স্তৰৰ টিংকিংৰ সৈতে—কাৰ্নেল বিন্যাস, মেমৰি স্থান, আৰু XLA কমপাইলাৰৰ সৈতে মল্লযুঁজ কৰি—মই এই বৰ্গক্ষেত্ৰৰ পেগটোক এটা ঘূৰণীয়া, টেনছৰ-প্ৰচেছিং-আকৃতিৰ ফুটাত ফিট কৰিব পাৰিম। প্ৰাৰম্ভিকভাৱে কেৱল কাৰিকৰী বিজয়ৰ ওপৰত গুৰুত্ব দিয়া হৈছিল, ব্যৱস্থাটোৰ দীৰ্ঘম্যাদী হৃদস্পন্দনৰ ওপৰত নহয়।

অদৃশ্য জটিলতাৰ কেস্কেড

প্ৰথম "সফলতা" আছিল মাদক। কেইবা সপ্তাহৰ পাছত চলাবলৈ মডেল এটা পালোঁ৷ কিন্তু জয় ফুটা আছিল। হেকটো ভংগুৰ আছিল, প্ৰতিটো সৰু সৰু লাইব্ৰেৰী আপডেটৰ লগে লগে ভাঙি গৈছিল। ইয়াতকৈও বেয়া কথাটো হ’ল, ই সমগ্ৰ পাইপলাইনটোত অদৃশ্য ড্ৰেগ সৃষ্টি কৰিছিল। বেচপক TPU ক'ড পথ এটা চাইলো হৈ পৰিল, আমাক পৃথক মোতায়েন স্ক্ৰিপ্ট, নিৰীক্ষণ হুক, আৰু আনকি ডাটা-লোডিং লজিক ৰক্ষণাবেক্ষণ কৰিবলৈ বাধ্য কৰালে। যিটো এটা অনুকূলিত মডিউল হ’ব বুলি কোৱা হৈছিল, সেয়া হৈ পৰিল এটা ভংগুৰ ক’লা বাকচ। আমি যন্ত্ৰণাদায়ক বিফলতা অনুভৱ কৰিলোঁ:

মডুলাৰ মানসিকতা: বল-ফিটিঙৰ ওপৰত সংহতি

মূল পাঠটো TPU বা মনোযোগ এলগৰিদমৰ বিষয়ে নাছিল। কথাটো আছিল মডুলাৰিটিৰ কথা। আমি এটা মৌলিক নীতি উলংঘা কৰিছিলোঁ: এটা ব্যৱস্থাৰ উপাদানসমূহ শ্বেপযোগ্য আৰু আন্তঃকাৰ্য্যক্ষম হ'ব লাগে, একেলগে ৱেল্ডিং কৰা নহয়। আমাৰ ষ্টেকত এটা অ-স্থানীয় উপাদান জোৰ কৰি, আমি এটা কাল্পনিক শিখৰ পৰিৱেশনৰ বাবে স্থিৰতা, স্পষ্টতা আৰু চঞ্চলতাক ত্যাগ কৰিলোঁ যিটো উৎপাদনত খুব কমেইহে উপলব্ধি কৰা হৈছিল। এইখিনিতে মেৱেজৰ দৰে মডিউলাৰ ব্যৱসায়িক অ’ এছৰ দৰ্শন গুৰুত্বপূৰ্ণ হৈ পৰে। মেৱাইজ আপোনাক এটা ষ্টেকত লক কৰা নহয়; ই অৰ্কেষ্ট্ৰেচন স্তৰ প্ৰদান কৰাৰ বিষয়ে যি আপোনাক কামৰ বাবে সৰ্বোত্তম সঁজুলি ব্যৱহাৰ কৰাৰ অনুমতি দিয়ে—সেয়া এটা GPU-নিৰ্দিষ্ট অনুকূলন হওক বা এটা TPU-স্থানীয় আৰ্হি হওক—নিজে সংযুক্ত কলা নিৰ্মাণ আৰু ৰক্ষণাবেক্ষণ নকৰাকৈ।

শিক্ষণ আৰু বহনক্ষম গতিলৈ পিভটিং

আমি শেষত বলপূৰ্বক Flash Attention পৰীক্ষাটো শ্বেলফত ৰাখিলোঁ। ইয়াৰ পৰিৱৰ্তে আমি এটা টিপিইউ-স্থানীয় মনোযোগ প্ৰণয়নলৈ পিভট কৰিলোঁ যিটো কাগজত তাত্ত্বিকভাৱে লেহেমীয়া হ'লেও বহুত বেছি নিৰ্ভৰযোগ্য আৰু ৰক্ষণাবেক্ষণযোগ্য বুলি প্ৰমাণিত হ'ল। ইয়াৰ স্থিৰতাৰ বাবেই সামগ্ৰিক ব্যৱস্থাৰ থ্ৰুপুট প্ৰকৃততে উন্নত হৈছিল। তাতোকৈ গুৰুত্বপূৰ্ণ কথাটো হ’ল, আমি আমাৰ এআই সেৱাসমূহক বিচ্ছিন্ন, সুনিৰ্দিষ্ট মডিউল হিচাপে স্থাপত্য কৰিবলৈ আৰম্ভ কৰিলোঁ। চিন্তাৰ এই পৰিৱৰ্তন—কেঁচা, স্থানীয়কৃত পৰিৱেশনৰ সলনি উপাদানসমূহৰ মাজত পৰিষ্কাৰ চুক্তিক অগ্ৰাধিকাৰ দিয়া—ঠিক সেইটোৱেই ব্যৱসায়সমূহক বুদ্ধিমানৰূপে স্কেল কৰিবলৈ অনুমতি দিয়ে। দ্ৰুতগতিত বিকশিত হোৱা হাৰ্ডৱেৰৰ জগতখনত, Mewayz ৰ দৰে এটা প্লেটফৰ্মে চকা পুনৰ নিৰ্মাণ নকৰাকৈ, বা আমাৰ ক্ষেত্ৰত, প্ৰচেছৰ পুনৰ উদ্ভাৱন কৰিবলৈ চেষ্টা নকৰাকৈ নতুন ক্ষমতাসমূহ প্লাগ ইন কৰাৰ কাঠামো প্ৰদান কৰে। কঠিন পথটোৱে আমাক শিকাইছিল যে বহনক্ষম গতি প্ৰতিটো মাইক্ৰ’-যুদ্ধত জয়ী হোৱাটো নহয়, বৰঞ্চ আপোনাৰ সমগ্ৰ সেনাই একেলগে মাৰ্চ কৰিব পৰাটো নিশ্চিত কৰাটোৱেই।

আপোনাৰ সকলো ব্যৱসায়িক সঁজুলি এটা ঠাইত

একাধিক এপৰ জগলিং বন্ধ কৰক। মেৱাইজে মাত্ৰ ৪৯ ডলাৰ/মাহৰ বাবে ২০৮টা সঁজুলি একত্ৰিত কৰে — ইনভেণ্টৰীৰ পৰা এইচ আৰ, বুকিঙৰ পৰা বিশ্লেষণলৈকে। আৰম্ভ কৰিবলৈ কোনো ক্ৰেডিট কাৰ্ডৰ প্ৰয়োজন নাই।

মেৱাইজ ফ্ৰী চেষ্টা কৰক →

Try Mewayz Free

All-in-one platform for CRM, invoicing, projects, HR & more. No credit card required.

Start managing your business smarter today

Join 6,204+ businesses. Free forever plan · No credit card required.

Ready to put this into practice?

Join 6,204+ businesses using Mewayz. Free forever plan — no credit card required.

Start Free Trial →

Ready to take action?

Start your free Mewayz trial today

All-in-one business platform. No credit card required.

Start Free →

14-day free trial · No credit card · Cancel anytime