Google has introduced the Personal Health Large Language Model (PH-LLM), designed for sleep and fitness coaching applications, demonstrating expert-level performance in personal health monitoring using wearable device data, according to research published in Nature Medicine. PH-LLM is a fine-tuned version of Gemini Ultra 1.0 that can understand and reason with aggregated daily-resolution numerical sensor data converted to text format. The model achieved 79% accuracy on sleep medicine examinations and 88% on fitness tests, surpassing human experts who scored 76% and 71% respectively. In comprehensive evaluation involving 857 real-world case studies, PH-LLM performed similarly to human experts for fitness-related tasks and showed improved performance over the base Gemini model in providing personalized sleep insights. The model effectively predicted self-reported sleep quality using multimodal encoding of wearable sensor data, demonstrating its ability to contextualize various wearable modalities. Researchers noted that this work highlights the potential of LLMs to revolutionize personal health monitoring via tailored insights and predictions from wearable data. This study represents the first large-scale research demonstrating the commercial viability of AI technology in personalized healthcare coaching applications.
구글이 웨어러블 디바이스 데이터를 활용한 개인 건강 관리용 거대언어모델(LLM) 'PH-LLM'을 개발해 수면과 피트니스 코칭에서 인간 전문가 수준의 성능을 보인다고 네이처(Nature Medicine)에 발표했다. PH-LLM은 구글의 제미니 울트라 1.0(Gemini Ultra 1.0)을 기반으로 개발됐으며, 웨어러블 센서 데이터를 텍스트로 이해하고 추론할 수 있도록 파인튜닝됐다. 수면의학 객관식 시험에서 79%, 피트니스 시험에서 88%의 정확도를 기록해 각각 76%, 71%를 기록한 인간 전문가들을 앞섰다. 857개의 실제 사례 연구에서 PH-LLM은 피트니스 관련 업무에서 인간 전문가와 유사한 성능을 보였고, 개인화된 수면 인사이트 제공에서는 기본 제미니 모델보다 향상된 결과를 나타냈다. 또한 웨어러블 센서 데이터의 멀티모달 인코딩을 통해 자가 보고된 수면 품질을 효과적으로 예측할 수 있음을 입증했다. 연구팀은 이 연구가 웨어러블 데이터를 통한 맞춤형 인사이트와 예측으로 개인 건강 모니터링을 혁신할 LLM의 잠재력을 보여준다고 밝혔다. 이번 연구는 AI 기술이 개인화된 헬스케어 코칭 분야에서 상용화 가능성을 제시한 첫 번째 대규모 연구로 평가된다.
