قسم يركز على كل من البحث الأساسي والبحث التطبيقي، قدمت Google Research SensorLM، عائلة جديدة من نماذج اللغة الحسية-الأساسية المصممة لتعزيز تفسير بيانات المستشعر القابلة للارتداء عالية الأبعاد. تم تدريب SensorLM على 59.7 مليون ساعة من مدخلات المستشعر المتعددة من أكثر من 103,000 فرد، وهو قادر على إنتاج أوصاف مفصلة وقابلة للقراءة البشرية من إشارات المستشعر المعقدة، مما يضع معيارًا جديدًا في مجال تحليل بيانات المستشعر.
لتطوير مجموعة بيانات التدريب لـ SensorLM، تم أخذ عينة من حوالي 2.5 مليون يوم شخص من بيانات المستشعرات غير المحددة الهوية من 103,643 مشاركًا عبر 127 دولة. تم جمع هذه البيانات من أجهزة Fitbit و Pixel Watch خلال الفترة من 1 مارس إلى 1 مايو 2024، حيث قدم جميع المشاركين موافقة مستنيرة لاستخدام بياناتهم المجهولة في الأبحاث التي تهدف إلى تعزيز المعرفة العامة في الصحة والعلوم.
قام الباحثون بتنفيذ خط أنابيب هرمي تلقائي يولد تسميات وصفية من خلال حساب الإحصائيات، والتعرف على الأنماط، وتلخيص الأحداث مباشرة من بيانات المستشعرات للتعامل مع تحدي تصنيف البيانات على نطاق واسع. وقد مكن هذا النهج من إنشاء ما يُعتبر حاليًا أكبر مجموعة بيانات معروفة تتماشى بين مدخلات المستشعرات واللغة، متجاوزةً نطاق المجموعات المستخدمة في الأبحاث السابقة.
تدمج بنية SensorLM وتنسق بين منهجيات التدريب المسبق متعددة النماذج المستخدمة على نطاق واسع، لا سيما التعلم التبايني والتدريب المسبق التوليدي، في إطار موحد. في مرحلة التعلم التبايني، يتم تدريب النموذج على ربط أجزاء من بيانات المستشعر مع الوصف النصي المناسب المختار من مجموعة من البدائل.
تتيح هذه العملية للنموذج التفريق بدقة بين الأنشطة البدنية المختلفة أو الحالات الفسيولوجية، مثل التمييز بين السباحة الخفيفة وتمرينية تركز على القوة. في مرحلة التدريب المسبق التوليدي، يتعلم النموذج إنتاج أوصاف نصية مباشرة من مدخلات المستشعر، مما يعزز قدرته على نقل تفسيرات معقدة وحساسة للسياق للبيانات عالية الأبعاد. يسمح دمج استراتيجيات التدريب هذه لـ SensorLM بتشكيل فهم شامل ودقيق متعدد الوسائط لكيفية ارتباط بيانات المستشعر باللغة الطبيعية.
التجارب تكشف عن القدرات المتقدمة لـ SensorLM في التصنيف بدون عينة، التعلم من عدد قليل من الأمثلة، والفهم عبر الأنماط المختلفة
وفقًا لأبحاث جوجل، تم تقييم أداء SensorLM عبر سيناريوهات متنوعة من العالم الحقيقي تتضمن التعرف على نشاط الإنسان وتطبيقات الرعاية الصحية، مما يظهر تحسنًا واضحًا مقارنة بالنماذج الرائدة الموجودة في هذه المجالات. يعمل SensorLM بشكل جيد بشكل خاص في البيئات التي تحتوي على بيانات محدودة مصنفة. لقد أظهر قدرات تصنيف قوية بدون تدريب مسبق، حيث تعرف بشكل صحيح على 20 نشاطًا مختلفًا دون الحاجة إلى ضبط النموذج، وأظهر تعلمًا فعالًا من عدد قليل من الأمثلة، متكيفًا بسرعة مع المهام الجديدة بأمثلة قليلة. كما أن وظيفة استرجاع البيانات عبر الأنماط تتيح أيضًا التفسير المتبادل بين بيانات المستشعر واللغة الطبيعية، مما يسمح للمستخدمين بالبحث عن أنماط المستشعر باستخدام النص أو توليد أوصاف ذات صلة من مدخلات المستشعر - وهو نهج يدعم سير عمل تحليل الخبراء.
بالإضافة إلى التصنيف ، فإن SensorLM قادر على توليد ملخصات نصية منظمة ومدركة للسياق بناءً فقط على إدخالات المستشعرات القابلة للارتداء. تشير المقارنات التجريبية إلى أن هذه المخرجات عادةً ما تكون أكثر تماسكًا ودقة من تلك التي تولدها نماذج اللغة غير المتخصصة. كما لاحظت الأبحاث أن أداء SensorLM يتزايد بشكل متسق مع الزيادات في بيانات التدريب ، وحجم النموذج ، والموارد الحاسوبية ، متماشياً مع المبادئ التي تم إثباتها سابقًا في توسيع النموذج. تشير هذه النتائج إلى أن النهج لا يزال في مرحلة مبكرة من إمكانياته ويتطلب استكشافًا مستمرًا.
يقدم تطوير SensorLM إطارًا لتفسير بيانات المستشعرات القابلة للارتداء المعقدة من خلال اللغة الطبيعية. وقد أصبح هذا ممكنًا من خلال طريقة جديدة للتعليق الهرمي وما يُعتقد أنه أكبر مجموعة بيانات لمستشعرات اللغة تم تجميعها حتى الآن. نتيجة لذلك، توفر عائلة نماذج SensorLM خطوة للأمام في تعزيز إمكانية الوصول وفائدة بيانات الصحة الشخصية. من خلال تمكين الآلات من تفسير الإشارات الفسيولوجية من خلال اللغة، تضع هذه العمل الأساس لمزيد من التغذية الراجعة الصحية المخصصة والمعلوماتية. ستستكشف الجهود المستقبلية التوسع في مجالات مثل تحليل التمثيل الغذائي ومراقبة النوم المتقدمة، مع الهدف الأوسع المتمثل في دعم أدوات العافية الشخصية وأنظمة مراقبة العيادات والمساعدين الصحيين الرقميين القادرين على التفاعل باللغة الطبيعية. قد يكون تطوير ونشر أي منتجات مستقبلية قائمة على هذا البحث عرضة للتحقق السريري والرقابة التنظيمية.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تقدم جوجل SensorLM الذي يترجم إشارات المستشعر إلى رؤى صحية تتمحور حول الإنسان
قسم يركز على كل من البحث الأساسي والبحث التطبيقي، قدمت Google Research SensorLM، عائلة جديدة من نماذج اللغة الحسية-الأساسية المصممة لتعزيز تفسير بيانات المستشعر القابلة للارتداء عالية الأبعاد. تم تدريب SensorLM على 59.7 مليون ساعة من مدخلات المستشعر المتعددة من أكثر من 103,000 فرد، وهو قادر على إنتاج أوصاف مفصلة وقابلة للقراءة البشرية من إشارات المستشعر المعقدة، مما يضع معيارًا جديدًا في مجال تحليل بيانات المستشعر.
لتطوير مجموعة بيانات التدريب لـ SensorLM، تم أخذ عينة من حوالي 2.5 مليون يوم شخص من بيانات المستشعرات غير المحددة الهوية من 103,643 مشاركًا عبر 127 دولة. تم جمع هذه البيانات من أجهزة Fitbit و Pixel Watch خلال الفترة من 1 مارس إلى 1 مايو 2024، حيث قدم جميع المشاركين موافقة مستنيرة لاستخدام بياناتهم المجهولة في الأبحاث التي تهدف إلى تعزيز المعرفة العامة في الصحة والعلوم.
قام الباحثون بتنفيذ خط أنابيب هرمي تلقائي يولد تسميات وصفية من خلال حساب الإحصائيات، والتعرف على الأنماط، وتلخيص الأحداث مباشرة من بيانات المستشعرات للتعامل مع تحدي تصنيف البيانات على نطاق واسع. وقد مكن هذا النهج من إنشاء ما يُعتبر حاليًا أكبر مجموعة بيانات معروفة تتماشى بين مدخلات المستشعرات واللغة، متجاوزةً نطاق المجموعات المستخدمة في الأبحاث السابقة.
تدمج بنية SensorLM وتنسق بين منهجيات التدريب المسبق متعددة النماذج المستخدمة على نطاق واسع، لا سيما التعلم التبايني والتدريب المسبق التوليدي، في إطار موحد. في مرحلة التعلم التبايني، يتم تدريب النموذج على ربط أجزاء من بيانات المستشعر مع الوصف النصي المناسب المختار من مجموعة من البدائل.
تتيح هذه العملية للنموذج التفريق بدقة بين الأنشطة البدنية المختلفة أو الحالات الفسيولوجية، مثل التمييز بين السباحة الخفيفة وتمرينية تركز على القوة. في مرحلة التدريب المسبق التوليدي، يتعلم النموذج إنتاج أوصاف نصية مباشرة من مدخلات المستشعر، مما يعزز قدرته على نقل تفسيرات معقدة وحساسة للسياق للبيانات عالية الأبعاد. يسمح دمج استراتيجيات التدريب هذه لـ SensorLM بتشكيل فهم شامل ودقيق متعدد الوسائط لكيفية ارتباط بيانات المستشعر باللغة الطبيعية.
التجارب تكشف عن القدرات المتقدمة لـ SensorLM في التصنيف بدون عينة، التعلم من عدد قليل من الأمثلة، والفهم عبر الأنماط المختلفة
وفقًا لأبحاث جوجل، تم تقييم أداء SensorLM عبر سيناريوهات متنوعة من العالم الحقيقي تتضمن التعرف على نشاط الإنسان وتطبيقات الرعاية الصحية، مما يظهر تحسنًا واضحًا مقارنة بالنماذج الرائدة الموجودة في هذه المجالات. يعمل SensorLM بشكل جيد بشكل خاص في البيئات التي تحتوي على بيانات محدودة مصنفة. لقد أظهر قدرات تصنيف قوية بدون تدريب مسبق، حيث تعرف بشكل صحيح على 20 نشاطًا مختلفًا دون الحاجة إلى ضبط النموذج، وأظهر تعلمًا فعالًا من عدد قليل من الأمثلة، متكيفًا بسرعة مع المهام الجديدة بأمثلة قليلة. كما أن وظيفة استرجاع البيانات عبر الأنماط تتيح أيضًا التفسير المتبادل بين بيانات المستشعر واللغة الطبيعية، مما يسمح للمستخدمين بالبحث عن أنماط المستشعر باستخدام النص أو توليد أوصاف ذات صلة من مدخلات المستشعر - وهو نهج يدعم سير عمل تحليل الخبراء.
بالإضافة إلى التصنيف ، فإن SensorLM قادر على توليد ملخصات نصية منظمة ومدركة للسياق بناءً فقط على إدخالات المستشعرات القابلة للارتداء. تشير المقارنات التجريبية إلى أن هذه المخرجات عادةً ما تكون أكثر تماسكًا ودقة من تلك التي تولدها نماذج اللغة غير المتخصصة. كما لاحظت الأبحاث أن أداء SensorLM يتزايد بشكل متسق مع الزيادات في بيانات التدريب ، وحجم النموذج ، والموارد الحاسوبية ، متماشياً مع المبادئ التي تم إثباتها سابقًا في توسيع النموذج. تشير هذه النتائج إلى أن النهج لا يزال في مرحلة مبكرة من إمكانياته ويتطلب استكشافًا مستمرًا.
يقدم تطوير SensorLM إطارًا لتفسير بيانات المستشعرات القابلة للارتداء المعقدة من خلال اللغة الطبيعية. وقد أصبح هذا ممكنًا من خلال طريقة جديدة للتعليق الهرمي وما يُعتقد أنه أكبر مجموعة بيانات لمستشعرات اللغة تم تجميعها حتى الآن. نتيجة لذلك، توفر عائلة نماذج SensorLM خطوة للأمام في تعزيز إمكانية الوصول وفائدة بيانات الصحة الشخصية. من خلال تمكين الآلات من تفسير الإشارات الفسيولوجية من خلال اللغة، تضع هذه العمل الأساس لمزيد من التغذية الراجعة الصحية المخصصة والمعلوماتية. ستستكشف الجهود المستقبلية التوسع في مجالات مثل تحليل التمثيل الغذائي ومراقبة النوم المتقدمة، مع الهدف الأوسع المتمثل في دعم أدوات العافية الشخصية وأنظمة مراقبة العيادات والمساعدين الصحيين الرقميين القادرين على التفاعل باللغة الطبيعية. قد يكون تطوير ونشر أي منتجات مستقبلية قائمة على هذا البحث عرضة للتحقق السريري والرقابة التنظيمية.