하버드 로스쿨 도서관, 기관 데이터 이니셔티브 시작
오늘 하버드 로스쿨 도서관은 기관 데이터 이니셔티브(IDI)를 공개했습니다 . 이 선구적인 연구 프로젝트는 도서관, 박물관, 정부 기관 및 다양한 조직과 협력하여 컬렉션을 디지털화하고 접근 가능한 데이터로 게시하는 것을 목표로 합니다. 이러한 데이터는 특히 고급 AI 모델을 훈련하는 데 있어 수많은 애플리케이션을 지원할 준비가 되어 있습니다.
이니셔티브의 주요 분야
IDI의 초기 노력은 하버드 도서관에서 디지털화된 100만 권의 퍼블릭 도메인 도서 컬렉션을 강화하는 데 집중될 것입니다. 또한 보스턴 공공 도서관과 협력하여 수백만 페이지에 달하는 역사적 신문을 사용 가능한 데이터 형식으로 변환할 것입니다. 주된 초점은 장문 텍스트이지만 IDI는 과학 및 생물의학 데이터 세트를 포함한 다양한 데이터 유형을 포괄하는 파트너십을 모색할 계획입니다.
지원 및 자금 조달
이 이니셔티브는 업계 리더인 Microsoft와 OpenAI의 지원을 받고 있으며, 이는 목표에 대한 강력한 기관적 지원을 의미합니다. IDI는 앞으로 자선 단체 및 업계 이해 관계자와의 협력을 통해 지속적인 자금 조달을 확보하는 것을 목표로 합니다.
주요 이해 관계자의 성명
Microsoft의 부사장 겸 부총고문인 버튼 데이비스는 이 이니셔티브의 중요성에 대해 다음과 같이 언급했습니다.
“Microsoft는 모든 AI 빌더를 위한 지식과 고품질 데이터에 대한 접근성을 높이기 위해 노력하는 Institutional Data Initiative의 설립을 지원하게 되어 자랑스럽게 생각합니다. 우리는 광범위한 데이터 접근성을 가능하게 하고 보다 포괄적인 AI 생태계를 강화하는 데 전념합니다. 2020년부터 우리는 데이터 격차를 해소하기 위해 노력해 왔으며, 모든 조직이 혁신하고 더 많은 것을 달성하는 데 필요한 데이터에 액세스할 수 있도록 보장했습니다. 이는 활기차고 경쟁력 있는 AI 경제를 성장시키는 데 필수적입니다.”
Microsoft의 관점은 오픈 데이터를 중심으로 한 협업의 중요성을 강조합니다. 2020년에 이 회사는 AI 기술을 개발하고자 하는 조직이 중요한 데이터 리소스에 액세스할 수 있도록 하는 오픈 데이터 캠페인을 시작했습니다.
OpenAI의 지적 재산 및 콘텐츠 책임자인 Tom Rubin도 IDI에 대한 자신의 생각을 공유했습니다.
“학술 기관은 오랫동안 인공지능 연구와 진보에 있어 핵심 파트너였으며, 하버드의 기관 데이터 이니셔티브는 이에 대한 강력한 사례입니다. 공공 도메인은 지식과 창의성의 확산에 중요한 역할을 하며, OpenAI는 이러한 노력을 지원하게 되어 기쁩니다. 우리는 이 중요한 프로젝트 전반에 걸쳐 Zittrain 교수의 리더십에 영감을 받았으며 그 영향을 보고 싶습니다.”
결론
기관 데이터 이니셔티브는 광범위한 데이터 세트에 대한 오픈 액세스를 제공함으로써 AI 기술을 발전시키고 그 혜택을 더 많은 사람이 누릴 수 있도록 하는 데 중요한 역할을 할 준비가 되어 있습니다.
자세한 내용은 출처를 방문해 보세요 .
답글 남기기