يمكنك تخزين هذه القيم لكل مواصفة، حيث أن مصفوفات JSON مناسبة لـ "8g 256g" على أساس كل مواصفة، والحصول على الأسعار المقترنة فقط. من أجل تخزين بيانات تعريف عشوائية لكل مدخل في Sphinx، وجلب بيانات تعريف ممتازة تحتوي فقط على أحدث المدخلات المقترنة. تجدر الإشارة إلى أن النظر إلى شجرة الاستعلام الجديدة لمساعدتك في تقييد أحدث عوامل التشغيل المتداخلة يبدو بسيطًا للوهلة الأولى، ولكنه اتضح أنه صعب الاستخدام بشكل مفاجئ (لأنه يتطلب وقتًا طويلاً). يجب أن تتطابق جميع عبارات Ribbon في إعداد "annotationsmatching" المحدد.
يدمج الأمر الفرعي Blend فهرسين من نوع Feet موجودين. هذه تسجيل الدخول إلى تطبيق Gate777 ليست هواية شائعة، لكنها أداة مفيدة عند إعداد برامج الزحف لأول مرة. ينشئ الأمر الفرعي Make دليل Base عاديًا من بحث المصدر. يتم إنشاء RID تلقائيًا، لكن repl_uid يسمح بتكوينه يدويًا. اختياري، القيمة الافتراضية فارغة (أي يتم إنشاؤه تلقائيًا).
لدى الوحدة السرية
كما هو موضح في السؤال، تُعامل جميع الرموز "كما هي". حيث تُخلط الأحرف الخاصة. تتكون قاعدتها من ثلاثة رموز (you، s، وa)؛ وإعدادها الكامل الجديد (المُحتفظ به لـ trim_none) هو gloomer-case &you.sa! مما قد يوفر لك عددًا ملحوظًا من حجم الفهرس ووقت الفهرسة. قد تكون هذه إضافة مفيدة للتجزئة العادية التي تعتمد على charset_table. سيتم الاحتفاظ بالرموز "السحرية" الثلاثة تقريبًا. تمامًا كما هو الحال بدون merge_chars، مع الأخذ في الاعتبار charset_desk فقط.
مرجع الميزات
في ظل الظروف الصعبة الجديدة، يُعد التحوّط خيارًا ممتازًا وسريعًا، حيث تُنفّذ معظم الوكالات طلباتها في غضون 3 مللي ثانية. فإذا تمّ تنفيذ الطلب الأول قبل ذلك (خلال 270 مللي ثانية مثلًا)، فهذا ممتاز، وسنستخدم هذا الأداء ونلغي الطلب الثاني. بعد ذلك، عند 230 مللي ثانية من بدء الطلب، سنبدأ التحوّط ونُجري طلبنا الثاني. وبطبيعة الحال، ستنتهي الطلبات المحوّطة خلال ضعف المدة "المثالية" لها.

لذا، بالنسبة للعناكب ذات مؤشرات HNSW المنخفضة، يقوم Sphinx بخطوة تحسين تُسمى "التنقيح" بعد بحث ANN. بشكل افتراضي، نُحسّن البحث المُدمج باستخدام كلٍ من "في تلك الشروط" و"شراء مؤهل ANN بسبب المصطلح". مع عناكب غير HNSW، يقوم Sphinx أيضًا "بتنقيحها" عن طريق حساب نطاقات دقيقة. كل هذا من أجل فهم أفضل. لا يتم دعم المتجهات المحفوظة بتنسيق JSON عمدًا. تستخدم استعلامات المتجهات مركزًا واحدًا فقط لكل فهرس محلي. لا تسمح عناكب المتجهات بذلك بشكل عام؛ ويجب عليك الاعتماد على المنسق الجديد.
تُنفذ الاستعلامات الجديدة بسرعة كبيرة ضمن المثال. وقد تم قياس زمن استجابة كل استعلام بالمللي ثانية. قد يؤثر ذلك بشكل طفيف على الأداء، لذا يتم تعطيلها افتراضيًا. يقوم البرنامج بفك تشفير استعلام SphinxAPI (كما هو موضح في حساب التجميد الجديد في السجل)، ثم يُنشئ استعلامًا واحدًا بلغة SphinxQL، ويخرج. راجع قسم "استخدام دليل البيانات" لمزيد من التفاصيل.
يجب أن يحتوي أول اختلاف في json.trick على قناع البت، وفقًا لمتصفح إنترنت إكسبلورر. تُحسب الدالة BITSCOUNTSEQ() أطول سلسلة بتات مُخزنة ضمن مجموعة فرعية مُحددة من قناع البت، أو -1 عندما تكون "غير ذات صلة" (بما في ذلك "ليس قناع بت جيدًا"). تتحقق الدالة BITSCMPSEQ() مما إذا كانت المجموعة الفرعية المُحددة من قناع البت تحتوي على سلسلة متصلة من الأجزاء. يجب أن يكون الوسيط الجديد أي نوع عدد صحيح، وفقًا لمتصفح إنترنت إكسبلورر. تُخرج الدالة BITCOUNT() عدد الأجزاء التي تم تعيينها إلى 1 في وسيطها.
التاريخ والتدريب

لا تُساعد هذه الخيارات بشكل كامل في عمليات الإنتاج (بدون إدخالات). ربما ليست الخيارات القياسية الجديدة! لأن فهارس RT تُشبه إلى حد كبير جداول SQL العادية. إليك تقريرًا موجزًا عن الأنواع الجديدة.
يتم تجميع البيانات داخل أجزاء بحجم 32 بت (أربعة بايتات). لذا، يساهم حقل البت الأول (أو BOOL) الذي تضعه بأربعة بايتات لكل سطر، ولكن ما يليه يكون "متاحًا" حتى يتم استهلاك جميع البتات الـ 32. مع ذلك، يجب الانتباه إلى أننا قد نحتاج في وقت ما إلى تعديل نظام الأنواع في المستقبل، وستلاحظ بعض التغييرات في خيارات التغليف التلقائي. قد يتم استخدام فلسفة خارج التنوع. هناك حد أقصى للكتلة يبلغ أربعة ميغابايت لكل هدف (من البنية الرقمية). يتم استخدام JSON باستمرار مع ترميز رقمي قوي. يتم دعم JSON المعقد بشكل عشوائي مع المصفوفات المتداخلة والكائنات الفرعية وما إلى ذلك. لا تستخدم نوع FLOAT أبدًا للتكاليف، بل استخدم نوع BIGINT (أو حتى STRING في حالات نادرة).
خلاصة القول، جرب استخدام تعيينات المستند فقط عند إجراء عمليات التوسيع، لتجنب التأثير السلبي الكبير على الأداء العام. يمكننا الحصول على نفس النتيجة بشكل أفضل بكثير من خلال جلب الكلمات الأصلية فقط (كلمة "grrm" فقط في مثالنا). يُعد هذا مفيدًا جدًا لفهرسة عمليات التوسيع، ولهذا السبب يُظهر مثال تعيين grrm الجديد تعيينات أكثر من مجرد كلمة "george martin" فقط. يزداد الأمر سوءًا مع زيادة استخدام مجموعات الصرف المتقدمة (التي تتضمن ملفات بيانات متعددة للصرف، وأدوات تجذير الكلمات، وأدوات تحليل الكلمات).
استغرق تنفيذ قائمة لعمود UINT ذي عدد قليل من القيم (أقل من 1000) حوالي 45 ثانية؛ بينما استغرق تنفيذ قائمة لعمود BIGINT فريد نسبيًا يحتوي على حوالي 10 ملايين قيمة حوالي 26-27 ثانية. بدلًا من استخدام فهارس متعددة، من الأفضل أحيانًا استخدام فهرس واحد فقط! لنفترض أن لدي فهارس لأعمدة خطوط الطول والعرض، ويمكنني استخدامها. اطلب من مُحسِّن الاستعلام تحديد ما إذا كان يجب استخدام فهارس معينة أو تجاهلها في كل استعلام، وذلك لحساب الاستعلام الحالي. مثال: ORWHERE People(mva) في استعلامات من نوع (؟، ؟، …).
