فهرست مطالب

پیاده‌سازی ایزولیشن در پایگاه‌های داده مختلف

ایزولیشن (Isolation) در پایگاه‌های داده به معنای جداسازی تراکنش‌ها از یکدیگر است تا هر تراکنش گویی به تنهایی در حال اجرا است و از تغییرات نیمه‌کاره تراکنش‌های دیگر تأثیر نمی‌پذیرد. سطح ایزولیشن، تعیین‌کننده میزان جداسازی تراکنش‌ها است و بر خواندن داده‌ها و مشاهده تغییرات همزمان تأثیر می‌گذارد.

سطوح ایزولیشن

سطوح ایزولیشن مختلفی در پایگاه‌های داده تعریف شده است که هر کدام سطح متفاوتی از جداسازی را ارائه می‌دهند. از جمله این سطوح می‌توان به موارد زیر اشاره کرد:

Read Uncommitted: پایین‌ترین سطح ایزولیشن است و اجازه می‌دهد تراکنش‌ها داده‌های ناقص (Dirty Read) را بخوانند.
Read Committed: تراکنش‌ها فقط می‌توانند داده‌هایی را بخوانند که توسط سایر تراکنش‌ها تعهد شده‌اند.
Repeatable Read: تراکنش‌ها می‌توانند چندین بار یک رکورد را بخوانند و اطمینان حاصل کنند که مقدار خوانده شده یکسان است، مگر اینکه خود تراکنش آن را تغییر داده باشد.
Serializable: بالاترین سطح ایزولیشن است و تضمین می‌کند که تراکنش‌ها به صورت سری اجرا می‌شوند، گویی تنها یک تراکنش در سیستم وجود دارد.

روش‌های پیاده‌سازی ایزولیشن

برای پیاده‌سازی سطوح مختلف ایزولیشن، پایگاه‌های داده از روش‌های مختلفی استفاده می‌کنند که برخی از مهم‌ترین آن‌ها عبارتند از:

روش‌های پیاده‌سازی ایزولیشن با قفل‌ها (Locks):

ایزولیشن (Isolation) در پایگاه داده، به معنای جداسازی تراکنش‌ها از یکدیگر است تا هر تراکنش گویی به تنهایی در حال اجرا است و از تغییرات نیمه‌کاره تراکنش‌های دیگر تأثیر نمی‌پذیرد. یکی از روش‌های اصلی برای پیاده‌سازی ایزولیشن، استفاده از قفل‌ها (Locks) است.

قفل‌ها به عنوان مکانیزمی برای کنترل دسترسی همزمان به داده‌ها عمل می‌کنند. با استفاده از قفل‌ها، می‌توانیم اطمینان حاصل کنیم که تنها یک تراکنش در یک زمان به یک داده خاص دسترسی داشته باشد و از تداخل بین تراکنش‌ها جلوگیری کنیم.

انواع قفل‌ها

- - قفل‌های اشتراکی (Shared Locks):
    - به چندین تراکنش اجازه می‌دهند که همزمان یک داده را بخوانند.
    - برای عملیات خواندن استفاده می‌شود.
  - قفل‌های انحصاری (Exclusive Locks):
    - فقط به یک تراکنش اجازه می‌دهند که یک داده را در یک زمان تغییر دهد.
    - برای عملیات نوشتن و تغییر داده استفاده می‌شود.

سطوح مختلف ایزولیشن با قفل‌ها

با استفاده از ترکیب‌های مختلف قفل‌های اشتراکی و انحصاری، می‌توان سطوح مختلف ایزولیشن را پیاده‌سازی کرد:

- - Read Uncommitted: پایین‌ترین سطح ایزولیشن است. در این سطح، تراکنش‌ها می‌توانند داده‌هایی را بخوانند که هنوز توسط سایر تراکنش‌ها تعهد نشده‌اند (Dirty Read). از قفل استفاده نمی‌شود.
  - Read Committed: تراکنش‌ها فقط می‌توانند داده‌هایی را بخوانند که توسط سایر تراکنش‌ها تعهد شده‌اند. از قفل‌های اشتراکی برای محافظت از داده‌ها هنگام خواندن استفاده می‌شود.
  - Repeatable Read: تراکنش‌ها می‌توانند چندین بار یک رکورد را بخوانند و اطمینان حاصل کنند که مقدار خوانده شده یکسان است، مگر اینکه خود تراکنش آن را تغییر داده باشد. از قفل‌های اشتراکی برای محافظت از داده‌هایی که تراکنش قصد خواندن آن‌ها را دارد، استفاده می‌شود.
  - Serializable: بالاترین سطح ایزولیشن است و تضمین می‌کند که تراکنش‌ها به صورت سری اجرا می‌شوند. از قفل‌های انحصاری برای محافظت از داده‌هایی که تراکنش قصد تغییر آن‌ها را دارد، استفاده می‌شود.

روش‌های پیاده‌سازی قفل‌ها

- - قفل‌های دو مرحله‌ای (Two-Phase Locking):
    - در این روش، هر تراکنش در دو مرحله عمل می‌کند:
      - مرحله رشد (Growing Phase): تراکنش قفل‌های مورد نیاز خود را اخذ می‌کند.
      - مرحله انقباض (Shrinking Phase): تراکنش قفل‌های خود را آزاد می‌کند.
  - قفل‌های سطری (Row-Level Locking):
    - قفل‌ها در سطح سطر اعمال می‌شوند و تنها سطری را که تراکنش در حال دسترسی به آن است، قفل می‌کند.
  - قفل‌های صفحه‌ای (Page-Level Locking):
    - قفل‌ها در سطح صفحه اعمال می‌شوند و تمام سطرهای یک صفحه را قفل می‌کند.
  - قفل‌های جدولی (Table-Level Locking):
    - قفل‌ها در سطح جدول اعمال می‌شوند و کل جدول را قفل می‌کند.

مزایا و معایب استفاده از قفل‌ها

- - مزایا:
    - پیاده‌سازی ساده
    - کنترل دقیق بر دسترسی به داده‌ها
  - معایب:
    - احتمال بن‌بست (Deadlock)
    - کاهش همزمانی
    - هزینه بالای مدیریت قفل‌ها

مقایسه با روش‌های دیگر

در مقایسه با روش‌های دیگر مانند MVCC (Multi-Version Concurrency Control)، قفل‌ها به طور کلی کنترل بیشتری بر روی دسترسی به داده‌ها ارائه می‌دهند اما ممکن است باعث کاهش همزمانی و افزایش احتمال بن‌بست شوند.

انتخاب روش مناسب

انتخاب روش مناسب برای پیاده‌سازی ایزولیشن به عوامل مختلفی مانند نوع کاربرد، حجم داده، نیاز به همزمانی و سطح ایزولیشن مورد نیاز بستگی دارد.

در کل، قفل‌ها یک ابزار قدرتمند برای مدیریت همزمانی در پایگاه داده هستند، اما باید با دقت و توجه به پیچیدگی‌های آن‌ها استفاده شوند.

نسخه‌های چندگانه (Multi-Version Concurrency Control – MVCC)

MVCC یک تکنیک مدیریت همزمانی در پایگاه‌های داده است که به جای استفاده از قفل‌های سنتی برای کنترل دسترسی به داده‌ها، از نگهداری چندین نسخه از یک داده استفاده می‌کند. این روش به تراکنش‌ها اجازه می‌دهد تا به نسخه‌های مختلفی از داده‌ها دسترسی داشته باشند و در نتیجه، همزمانی را افزایش داده و احتمال بن‌بست را کاهش می‌دهد.

چگونه MVCC کار می‌کند؟

ایجاد نسخه جدید: هر بار که یک تراکنش می‌خواهد یک داده را تغییر دهد، یک نسخه جدید از آن داده ایجاد می‌شود. نسخه قدیمی همچنان قابل دسترسی است و تراکنش‌های دیگر می‌توانند به آن نسخه دسترسی داشته باشند.
خواندن داده‌ها: هر تراکنش به نسخه داده‌ای که در زمان شروع آن تراکنش وجود داشته است، دسترسی پیدا می‌کند. به این ترتیب، تراکنش‌ها از تغییرات نیمه‌کاره سایر تراکنش‌ها تأثیر نمی‌گیرند.
نوشتن داده‌ها: هنگامی که یک تراکنش می‌خواهد یک داده را تغییر دهد، یک نسخه جدید از آن داده ایجاد می‌شود و تغییرات در آن نسخه اعمال می‌شود.
حذف نسخه‌های قدیمی: نسخه‌های قدیمی داده‌ها پس از اینکه دیگر هیچ تراکنشی به آن‌ها نیاز نداشته باشد، حذف می‌شوند.

مزایای MVCC

افزایش همزمانی: MVCC به تراکنش‌ها اجازه می‌دهد تا به صورت موازی اجرا شوند بدون اینکه نگران تداخل با یکدیگر باشند.
کاهش بن‌بست: احتمال بن‌بست به طور قابل توجهی کاهش می‌یابد زیرا تراکنش‌ها نیازی به انتظار برای آزاد شدن قفل‌ها ندارند.
جلوگیری از خواندن آلوده (Dirty Read): تراکنش‌ها نمی‌توانند داده‌های ناقص یا نادرستی را بخوانند که توسط تراکنش‌های دیگر در حال تغییر است.
پشتیبانی از سطوح مختلف ایزولیشن: MVCC می‌تواند برای پیاده‌سازی سطوح مختلف ایزولیشن مانند Read Committed، Repeatable Read و Serializable استفاده شود.

معایب MVCC

هزینه حافظه: نگهداری چندین نسخه از داده‌ها می‌تواند به فضای ذخیره‌سازی بیشتری نیاز داشته باشد.
پیچیدگی پیاده‌سازی: پیاده‌سازی MVCC نسبت به روش‌های مبتنی بر قفل پیچیده‌تر است.

مقایسه MVCC با قفل‌ها

ویژگی	MVCC	قفل‌ها
همزمانی	بالا	پایین
احتمال بن‌بست	پایین	بالا
هزینه حافظه	بالا	پایین
پیچیدگی پیاده‌سازی	بالا	پایین

کاربردهای MVCC

سیستم‌های OLTP (Online Transaction Processing): برای سیستم‌هایی که نیاز به همزمانی بالا و جلوگیری از بن‌بست دارند، مانند سیستم‌های بانکی و رزرواسیون.
سیستم‌های تحلیلی: برای سیستم‌هایی که نیاز به خواندن داده‌ها بدون تأثیر از تغییرات همزمان دارند، مانند سیستم‌های گزارش‌گیری و تحلیل داده.

پایگاه‌های داده‌ای که از MVCC پشتیبانی می‌کنند

PostgreSQL: یکی از پایگاه‌های داده‌ای است که به طور گسترده از MVCC استفاده می‌کند و امکان پیکربندی دقیق سطوح ایزولیشن را فراهم می‌کند.
MySQL: از MVCC برای پیاده‌سازی برخی از سطوح ایزولیشن استفاده می‌کند.
Oracle: از MVCC و همچنین مکانیزم‌های دیگری مانند Snapshot Isolation پشتیبانی می‌کند.

در کل، MVCC یک تکنیک قدرتمند برای مدیریت همزمانی در پایگاه‌های داده است که می‌تواند به بهبود عملکرد و قابلیت اطمینان سیستم کمک کند.

- Timestamp Ordering
  
  Timestamp Ordering یک تکنیک مدیریت همزمانی در پایگاه‌های داده است که بر اساس زمان‌بندی تراکنش‌ها عمل می‌کند. در این تکنیک، به هر تراکنش یک زمان‌برچسب (Timestamp) اختصاص داده می‌شود. زمان‌برچسب‌ها به ترتیب زمانی افزایش می‌یابند و تراکنش‌هایی با زمان‌برچسب بالاتر دارای اولویت بیشتری در دسترسی به داده‌ها هستند.
  
  نحوه عملکرد Timestamp Ordering
  1. اختصاص زمان‌برچسب: هنگام شروع یک تراکنش، به آن یک زمان‌برچسب اختصاص داده می‌شود.
  2. خواندن داده‌ها: تراکنش‌ها می‌توانند داده‌ها را بخوانند بدون اینکه نیاز به قفل کردن آن‌ها داشته باشند.
  3. نوشتن داده‌ها: هنگامی که یک تراکنش می‌خواهد یک داده را تغییر دهد، ابتدا بررسی می‌کند که آیا تراکنش دیگری با زمان‌برچسب بالاتر، قبلاً آن داده را تغییر داده است یا خیر. اگر چنین باشد، تراکنش باید منتظر بماند تا تراکنش با زمان‌برچسب بالاتر به پایان برسد و سپس تغییرات خود را اعمال کند.
  4. تعهد تراکنش: هنگامی که یک تراکنش به پایان می‌رسد، تغییراتی که انجام داده است، به پایگاه داده اصلی اعمال می‌شوند.
  مزایای Timestamp Ordering
  - همزمانی بالا: Timestamp Ordering می‌تواند همزمانی بالایی را فراهم کند، زیرا تراکنش‌ها نیازی به انتظار برای آزاد شدن قفل‌ها ندارند.
  - کاهش بن‌بست: احتمال بن‌بست در Timestamp Ordering بسیار پایین است، زیرا تراکنش‌ها به ترتیب زمانی اجرا می‌شوند و از تداخل با یکدیگر جلوگیری می‌کنند.
  - سادگی پیاده‌سازی: Timestamp Ordering نسبت به برخی روش‌های دیگر مدیریت همزمانی، ساده‌تر پیاده‌سازی می‌شود.
  معایب Timestamp Ordering
  - مشکلات خواندن آلوده: ممکن است یک تراکنش داده‌هایی را بخواند که توسط تراکنش دیگری تغییر داده شده‌اند، اما هنوز تعهد نشده‌اند. این مشکل به عنوان “Dirty Read” شناخته می‌شود.
  - مشکلات خواندن تکراری متفاوت: ممکن است یک تراکنش یک داده را چندین بار بخواند و در هر بار خواندن، مقدار متفاوتی را مشاهده کند. این مشکل به عنوان “Non-Repeatable Read” شناخته می‌شود.
  - مشکلات خواندن فانتوم: ممکن است یک تراکنش در دو بار خواندن یک محدوده از داده‌ها، نتایج متفاوتی مشاهده کند، زیرا تراکنش‌های دیگر ممکن است در این فاصله زمانی سطرهایی را به این محدوده اضافه یا از آن حذف کرده باشند.
  کاربردهای Timestamp Ordering
  - سیستم‌های OLTP (Online Transaction Processing): Timestamp Ordering می‌تواند برای سیستم‌های OLTP که نیاز به همزمانی بالا و جلوگیری از بن‌بست دارند، استفاده شود.
  - سیستم‌های تحلیلی: Timestamp Ordering می‌تواند برای سیستم‌های تحلیلی که نیاز به خواندن داده‌ها بدون تأثیر از تغییرات همزمان دارند، استفاده شود.
  در کل، Timestamp Ordering یک تکنیک مدیریت همزمانی است که می‌تواند به بهبود عملکرد و قابلیت اطمینان سیستم‌های پایگاه داده کمک کند. با این حال، برای انتخاب مناسب این تکنیک، باید مزایا و معایب آن را در نظر گرفت و آن را با سایر تکنیک‌های مدیریت همزمانی مقایسه کرد.

- Optimistic Concurrency Control (OCC)
  
  Optimistic Concurrency Control (OCC) یک تکنیک مدیریت همزمانی در پایگاه‌های داده است که بر اساس فرضیه‌ای عمل می‌کند که تداخل بین تراکنش‌ها نادر است. در این روش، تراکنش‌ها به طور معمول بدون هیچ گونه قفل یا بررسی همزمانی اجرا می‌شوند و تنها در زمان تعهد تراکنش، بررسی می‌شود که آیا تداخلی رخ داده است یا خیر.
  
  نحوه عملکرد OCC
  1. شروع تراکنش: تراکنش شروع می‌شود و داده‌های مورد نیاز را می‌خواند.
  2. انجام تغییرات: تراکنش تغییرات مورد نظر خود را روی داده‌ها اعمال می‌کند.
  3. تعهد تراکنش: هنگام تعهد تراکنش، سیستم بررسی می‌کند که آیا در طول اجرای تراکنش، تراکنش دیگری همان داده‌ها را تغییر داده است یا خیر.
    - اگر هیچ تداخلی رخ نداده باشد، تراکنش تعهد می‌شود و تغییرات آن به پایگاه داده اصلی اعمال می‌شوند.
    - اگر تداخلی رخ داده باشد، تراکنش لغو (rollback) می‌شود و باید مجدداً اجرا شود.
  مزایای OCC
  - همزمانی بالا: OCC به دلیل اینکه از قفل‌ها استفاده نمی‌کند، همزمانی بسیار بالایی را فراهم می‌کند.
  - کاهش بن‌بست: احتمال بن‌بست در OCC بسیار پایین است، زیرا تراکنش‌ها به صورت مستقل اجرا می‌شوند و تنها در زمان تعهد بررسی می‌شوند.
  - سادگی پیاده‌سازی: OCC نسبت به تکنیک‌های مدیریت همزمانی مبتنی بر قفل، ساده‌تر پیاده‌سازی می‌شود.
  معایب OCC
  - کاهش یکپارچگی داده‌ها: اگر تداخلی رخ دهد و تراکنش لغو شود، ممکن است داده‌ها به حالت نامطلوب برسند.
  - هزینه عملکرد: در مواردی که تداخل بین تراکنش‌ها زیاد باشد، OCC ممکن است هزینه عملکرد بیشتری نسبت به تکنیک‌های مبتنی بر قفل داشته باشد.
  کاربردهای OCC
  - سیستم‌های با همزمانی بالا و حجم داده کم: OCC برای سیستم‌هایی که نیاز به همزمانی بسیار بالا دارند و حجم داده‌ها در آن‌ها کم است، مناسب است.
  - سیستم‌های خواندن-فقط: در سیستم‌هایی که فقط عملیات خواندن انجام می‌دهند، OCC می‌تواند به طور مؤثر استفاده شود.
  مقایسه OCC با سایر تکنیک‌های مدیریت همزمانی
  - قفل‌ها: OCC به طور کلی همزمانی بیشتری نسبت به تکنیک‌های مبتنی بر قفل ارائه می‌دهد، اما ممکن است در برخی موارد ریسک یکپارچگی داده‌ها را افزایش دهد.
  - MVCC: OCC و MVCC هر دو تکنیک‌های مدیریت همزمانی هستند که از قفل‌ها استفاده نمی‌کنند. با این حال، MVCC معمولاً برای سیستم‌های با حجم داده بالا و نیاز به یکپارچگی داده‌های بالا مناسب‌تر است.
  در کل، OCC یک تکنیک قدرتمند برای مدیریت همزمانی در پایگاه‌های داده است که می‌تواند به بهبود عملکرد و کاهش بن‌بست کمک کند. با این حال، قبل از استفاده از OCC، باید مزایا و معایب آن را به دقت در نظر گرفت و آن را با سایر تکنیک‌های مدیریت همزمانی مقایسه کرد.