متن خبر

ترفندهای خط فرمان که می توانید سریعتر از نوشیدن قهوه صبح یاد بگیرید

ترفندهای خط فرمان که می توانید سریعتر از نوشیدن قهوه صبح یاد بگیرید

شناسهٔ خبر: 444930 -




در این آموزش کوتاه، می‌خواهم چند ترفند و نکته را با شما در میان بگذارم تا به شما کمک کند با برخی از موقعیت‌های رایج در هنگام کار در خط فرمان لینوکس مقابله کنید.

موارد زیر را پوشش خواهیم داد:

پیدا کردن

xargs و nproc

مجموعه وظایف

numactl

تماشا کردن

inotify-tools

من به شما یک چالش و ابزارهایی را ارائه می کنم که نشان می دهد چگونه هر مشکل را حل کنید.

آنچه شما نیاز دارید:

یک توزیع لینوکس

کنجکاوی

نحوه مدیریت دایرکتوری ها با فایل های زیاد

ممکن است قبلاً با این مشکل مواجه شده باشید: سعی کردید یک ls در فهرستی با تعداد بسیار زیادی فایل انجام دهید، اما دستور خطای "لیست آرگومان خیلی طولانی" را نشان داد:

 josevnz@orangepi5:/data/test_xargs$ ls * -bash: /usr/bin/ls: Argument list too long

این به این دلیل است که سیستم‌های سازگار با POSIX برای حداکثر تعداد بایت‌هایی که می‌توانید به عنوان آرگومان ارسال کنید، محدودیت دارند:

 [josevnz@dmaf5 Documents]$ getconf ARG_MAX 2097152

2 میلیون بایت ممکن است زیاد به نظر برسد - یا بسته به اینکه از چه کسی بپرسید کافی نیست. اما همچنین محافظت در برابر حملات یا اشتباهات بی گناه با عواقب بد است.

در هر صورت چگونه می توان از این محدودیت عبور کرد؟ خوب، راه های زیادی برای انجام این کار وجود دارد.

استفاده از شل داخلی

Bash داخلی محدودیت ARG_MAX را ندارد:

 josevnz@orangepi5:/data/test_xargs$ echo *|ls ... test_file055554 test_file111110 test_file166666 test_file222222 test_file277778 test_file333334 test_file388890 test_file444446 test_file055555 test_file111111 test_file166667 test_file222223 test_file277779 test_file333335 test_file388891 test_file444447 test_file055556 test_file111112 test_file166668 test_file222224 test_file277780 test_file333336 test_file388892 test_file444448

این احتمالا ساده ترین راه حل است، اما اجازه دهید راه دیگری را ببینیم.

استفاده از find when شما گزینه های قالب بندی را می خواهید

یا می توانید از این پرچم find معروف استفاده کنید:

 find /data/test_xargs -type f -ls -printf '%name'

یا با قالب بندی ، برای تقلید از ls :

 find /data/test_xargs -type f -printf '%f\n

این سریع و همچنین کامل ترین راه حل است. اما قبل از حرکت، راه دیگری را به شما نشان خواهم داد.

استفاده از xargs

آثار زیر:

 find /data/test_xargs -type f -print0 | xargs -0 ls

اما ناکارآمد است، زیرا شما در حال انشعاب 3 فرآیند برای نمایش محتویات دایرکتوری هستید. و علاوه بر آن، xargs تعداد فایل‌هایی را که به دستور ls ارسال می‌شوند را کنترل می‌کند .

بیایید جلو برویم و یک مشکل متفاوت را تحلیل کنیم.

چگونه برنامه های بیشتری را بدون خرابی سرور اجرا کنیم

ابتدا راه می روید سپس می دوید: این کار را به صورت سریالی انجام دهید

پس بگویید که می خواهید تمام فایل های موجود در فهرست داده شده را از مثال قبلی ما فشرده کنید. اولین تلاش به این صورت خواهد بود:

 gzip *

که زمان زیادی طول می کشد زیرا gzip هر بار یک فایل را پردازش می کند.

ممکن است فکر کنید برای فشرده سازی فایل ها به صورت موازی کاری شبیه به این انجام دهید:

 josevnz@orangepi5:/data/test_xargs$ for file in $(ls data/test_xargs/*); do gzip $file &; done -bash: /usr/bin/ls: Argument list too long

دوباره، ARG_MAX دوباره ضربه می زند.

ما xargs را می شناسیم یا اکنون پیدا می کنیم، پس اگر این کار را انجام دهیم چه می شود:

 for file in $(find $PWD); do echo gzip $file &; done wait echo "All files compressed?"

این کار باعث می شود حافظه سرور شما تمام شود یا آن را تحت استفاده بسیار سنگین از CPU خرد می کند زیرا شما برای هر فایلی که پیدا می شود یک نمونه gzip را فورک می کنید.

اولین تلاش ما برای موازی سازی و خفه کردن (هنر کنترل خود)

آنچه شما نیاز دارید راهی برای کاهش درخواست‌های فشرده‌سازی است، پس فرآیندهای بیشتری از تعداد CPUSی که دارید راه‌اندازی نکنید.

بیایید دوباره آن را با find و xargs امتحان کنیم:

 find /data/test_xargs -type f -print0| xargs -0 -P $(($(nproc)-1)) -I % gzip %

اوه به نظر می رسد یک خط فانتزی است. بگذارید توضیح دهم که چگونه کار می کند:

    از find برای دریافت همه فایل‌ها در فهرست داده شده استفاده کنید، از کاراکتر null به عنوان جداکننده استفاده کنید تا بتوانید فایل‌های با نام‌های عجیب را پردازش کنید.

    nproc به شما او میگوید چند CPUS دارید، سپس با استفاده از محاسبات Bash با استفاده از پوسته‌های فرعی، 1 را کم کنید: $(($(nproc)-1))

    در نهایت، xargs بیش از -P فرآیندها را اجرا نخواهد کرد (در مورد من 8 CPUS - 1 = 7 کار)، جایگزین "%" با نام فایل برای فشرده سازی می شود.

توجه: راه‌های دیگری برای دریافت تعداد CPUS روی دستگاه وجود دارد، مانند تجزیه /proc/cpuinfo . فشرده‌سازی کارآمدتر دیگری نیز وجود دارد، اما gzip تقریباً در هر لینوکس/یونیکس موجود است.

خوب، وقت آن است که مشکل بعدی خود را ببینیم.

CPU Affinity با مجموعه وظایف برای به حداکثر رساندن زمان اجرا

با وجود محدود کردن تعداد پردازنده‌ها، برخی از کارهای فشرده می‌توانند هنگام جستجوی منابع، فرآیندهای دیگر را در دستگاه شما کاهش دهند. چند کار وجود دارد که می توانید برای تحت کنترل نگه داشتن عملکرد سرور انجام دهید، مانند استفاده از مجموعه وظایف :

دستور taskset برای تنظیم یا بازیابی CPU affinity استفاده می شود
از یک فرآیند در حال اجرا با توجه به pid آن، یا برای راه اندازی یک دستور جدید
با یک میل CPU معین. CPU affinity یک ویژگی زمانبندی است
که یک فرآیند را به مجموعه ای از CPU های موجود در سیستم "پیوند" می کند.

به طور کلی، ما همیشه قصد داریم یکی از CPUS را برای وظایف سیستم عامل "رایگان" بگذاریم. هسته معمولاً برای جلوگیری از تعویض متن، فرآیندهای در حال اجرا را به یک CPU خاص چسبانده است، اما اگر می‌خواهید روی CPU اجرا شود، می‌توانید از tasket استفاده کنید.

 taskset -c 1,2,3,4,5,6,7 find /data/test_xargs -type f -print0| xargs -0 -P $(($(nproc)-1)) -I % gzip %

taskset تنها بازی در شهر است؟ نه خیلی سریع!

NUMA چیست و چرا باید اهمیت دهید ؟

محدودیت‌های فیزیکی برای سخت‌افزار وجود دارد که در صورت نیاز به تعداد زیادی CPU و حافظه زیاد با آن مواجه می‌شویم. محدودیت مهم این است که پهنای باند ارتباطی محدودی بین CPU و حافظه وجود دارد.

یکی از اصلاحات معماری که برای رفع این مشکل معرفی شد، دسترسی به حافظه غیریکنواخت (NUMA) است.

پس اکثر ماشین های دسکتاپ ساده فقط یک گره NUMA دارند، مانند من:

 [josevnz@dmaf5 ~]$ numactl --hardware available: 1 nodes (0) node 0 cpus: 0 1 2 3 4 5 6 7 node 0 size: 15679 MB node 0 free: 5083 MB node distances: node 0 0: 10 # Or with lscpu [josevnz@dmaf5 ~]$ lscpu |rg NUMA NUMA node(s): 1 NUMA node0 CPU(s): 0-7

اگر بیش از یک گره NUMA دارید، ممکن است بخواهید "پین" یا وابستگی برنامه خود را برای استفاده از CPUS و حافظه همان گره تنظیم کنید.

به عنوان مثال، در ماشینی با 16 هسته، 0-7 در گره 0، 8-15 در گره 1، می توانیم برنامه فشرده سازی خود را مجبور کنیم که روی تمام CPUS گره 1 اجرا شود و از حافظه گره 1 به این صورت استفاده کنیم:

 numactl --physcpubind 8-15 --membind=1 find /data/test_xargs -type f -print0| xargs -0 -P $(($(nproc)-1)) -I % gzip %

زیر نظر گرفتن چیزها

فقط مراقب کارم باش

دستور watch به شما امکان می دهد به صورت دوره ای یک فرمان را اجرا کنید و حتی قبل از تماس تفاوت ها را به شما نشان دهد:

 Every 10.0s: ls orangepi5: Wed May 24 22:46:33 2023 test_file000001.gz test_file000002.gz test_file000003.gz test_file000004.gz test_file000005.gz test_file000006.gz test_file000007.gz test_file000008.gz test_file000009.gz test_file000010.gz ...

خروجی دستور ls را هر 10 ثانیه به من نشان می دهد. تشخیص تغییرات در یک فهرست ساده است، اما خودکار کردن آن آسان نیست و قطعا کارآمد نیست.

خوب نیست اگر هسته بتواند تغییراتی را که در دایرکتوری های من انجام می شود به من بگوید؟

راه بهتری برای دانستن تغییرات در سیستم فایل با inotify-tools

ممکن است لازم باشد این را جداگانه نصب کنید، اما انجام آن باید آسان باشد. در اوبونتو:

 sudo apt-get install inotify-tools

در فدورا:

 sudo dnf install -y inotify-tools

پس چگونه می‌توانیم رویدادها را در یک فهرست مشخص نظارت کنیم؟

در یک ترمینال می توانیم inotifywait را اجرا کنیم:

 josevnz@orangepi5:/data/test_xargs$ inotifywait --recursive /data/test_xargs/ Setting up watches. Beware: since -r was given, this may take a while! Watches established.

و در یک ترمینال دیگر می توانیم برخی از فایل ها را برای شبیه سازی یک رویداد لمس کنیم:

 josevnz@orangepi5:/data/test_xargs$ pwd /data/test_xargs josevnz@orangepi5:/data/test_xargs$ touch test_file285707.gz test_file357136.gz test_file428565.gz

ترمینال اصلی اولین رویداد و خروج را دریافت می کند:

 Watches established. /data/test_xargs/ OPEN test_file285707.gz

برای اینکه حتی برای همیشه گوش کند، این کار را انجام می دهیم:

 josevnz@orangepi5:/data/test_xargs$ inotifywait --recursive --monitor /data/test_xargs/

اگر دوباره فایل را در یک ترمینال جداگانه لمس کنیم، این بار همه رویدادها را خواهیم دید:

 Setting up watches. Beware: since -r was given, this may take a while! Watches established. /data/test_xargs/ OPEN test_file285707.gz /data/test_xargs/ ATTRIB test_file285707.gz /data/test_xargs/ CLOSE_WRITE,CLOSE test_file285707.gz /data/test_xargs/ OPEN test_file357136.gz /data/test_xargs/ ATTRIB test_file357136.gz /data/test_xargs/ CLOSE_WRITE,CLOSE test_file357136.gz /data/test_xargs/ OPEN test_file428565.gz /data/test_xargs/ ATTRIB test_file428565.gz /data/test_xargs/ CLOSE_WRITE,CLOSE test_file428565.gz

این نسبت به درخواست هر بار تغییر دایرکتوری و فیلتر کردن تفاوت‌ها به سیستم عامل کمتر است.

چه چیزی بعد

چیزهای بیشتری برای کشف وجود دارد. نکات بالا شما را با مفاهیم مهم آشنا می کند، پس چرا بیشتر در مورد آنها یاد نگیرید؟

انجمن اوبونتو یک گفتگوی عالی در مورد xargs ، find ، ulimit و موارد دیگر دارد. دانش قدرت است.

RedHat به عنوان یک صفحه خوب در مورد NUMA، مجموعه وظایف، مدیریت وقفه. اگر در مورد تنظیم دقیق عملکرد فرآیندهای خود جدی هستید، لطفاً آن را بخوانید.

شما inotify را دوست داشتید و می خواهید از اسکریپت پایتون خود از آن استفاده کنید. سپس به pynotify نگاهی بیندازید.

یافتن ممکن است ترسناک باشد، اما این آموزش درک آن را آسان‌تر می‌کند.

کد منبع این آموزش را می توانید در اینجا بیابید.

خبرکاو

ارسال نظر




تبليغات ايهنا تبليغات ايهنا

تمامی حقوق مادی و معنوی این سایت متعلق به خبرکاو است و استفاده از مطالب با ذکر منبع بلامانع است