D-데이터허브

분석지원 FLOW

  1. 사전활동

    • 수요조사 및 방문 인터뷰를 통한 현안 파악
    • 데이터 보유현황 파악
    • 데이터 전처리 및 통계 관련 컨설팅
    • 교육 필요 시 별도 안내
  2. 과제선정

    • 분석과제 선정
    • 분석의 범위, 세부 분석방법론 정립
    • 활용센터 내 분석 진행
    • 각 단계별 이론/ 기술적 분석지원
  3. 결과도출

    • 데이터 분석 및 시각화 도출
    • 분석 고도화를 위한 컨설팅
    • 분석 결과물에 한하여 외부반출
      (데이터 반출불가)

분석지원 사례

  • 사례1. 빅데이터를 활용한 전동보장구 충전소 입지분석
    • 본 연구는 대구광역시 북구 전동보장구 충전소 입지분석을 위해 전동보장구를 주로 이용하는 고령자 유동인구, 특별교통수단(나드리콜) 배차이력, 공공 및 복지시설 건물데이터 등을 수집하였음
    • 이를 공간적으로 분석하기 위해 대구시 북구내 300M X 300M 격자를 생성하고 각 격자별로 다양한 요인변수들을 수집하여 데이터 셋을 구축함
    • 전동보장구 충전소 입지분석은 크게 2가지 방법으로 구분하여 분석을 시도하였으며 다음과 같음
    • 첫번째, 전동보장구 충전소 입지에 영향을 미칠 것으로 판단되는 다양한 요인들의 가중치를 지자체 담당자 및 장애인협회 관계자 FGI(Focus Group Interview) 면접을 통하여 산정하였으며, 이를 점수로 합산하여 우선지역을 등급화하여 도출하였음
    • 두번째, 기존의 북구를 제외한 다른 지자체에서 설치된 지역의 배후지 특성들을 딥러닝으로 학습하여 북구지역의 전동보장구 충전소 추가 설치지역을 제안하였음
    • 이러한 분석결과를 바탕으로 지자체에서 전동보장구 충전소 입지분석시 과학적이고 정량화된 방법으로 접근이 가능할 것으로 판단되며, 전동보장구 충전으로 어려움을 겪고 있는 고령자와 장애인들의 통행환경 개선에 기여할 것으로 판단됨

    주제어 : 교통약자, 전동보장구, 충전소 입지분석, 딥러닝, 빅데이터

  • 사례2. 빅데이터 인공지능을 활용한 도서관 장서 포화문제 해결 연구
    • 본 연구에서는 공공도서관의 장서 포화문제를 해결하기 위해 최근 4차 산업혁명으로 각광받고 있는 빅데이터, 인공지능 기술을 접목하여 분석을 수행함
    • 대다수 선행연구에서 미대출 도서의 폐기, 이관, 물리적공간 확대 등의 접근이 주를 이루고 있으나, 본 연구에서는 미대출 도서를 인기도서와 연계하여 추천한다는 점에서 차별성이 있음
    • 공간적 범위는 미대출도서가 가장 높게 나타나는 두류도서관으로 한정하였으며, 시간적 범위는 2019년 1월부터 2020년 7월까지의 도서 관련 데이터를 활용함
    • 세부적인 데이터로는 두류도서관 도서정보, 대출이력, 회원정보 등을 수집하였으며, 추가적으로 도서관 정보나루의 API를 활용하여 도서 상세정보 등을 수집하였음
    • 미대출 도서 추천시스템을 구현하기 위해 크게 2가지 방법으로 시도하였으며, 다음과 같음
    • 첫 번째, 도서별 제목과 소개 내용을 결합하여 데이터를 생성하였으며, 이중 명사를 추출하여 Spherical K-means 클러스터링과 토픽모델링(LDA) 기법을 사용하여 카테고리를 추출함
    • 두 번째, 미대출 도서와 인기 도서 사이의 코사인 유사도(Cosine Similarity)를 계산하여 인기 도서와 유사한 미대출 도서를 성·연령별로추천하는 콘텐츠 기반 추천시스템을 구현함
    • 이를 시각화 프로그램인 Power BI를 통해 웹형태로 구축하여 고도화된 경험을 제공함

    주제어 : 도서관 장서포화, 미대출도서, 추천시스템, 코사인 유사도, 콘텐츠기반