서울, 경기, 인천의 1993-2019년 사업체 대표자 데이터 및 시각화 컨텐츠입니다.
KOSIS(통계청, 전국사업체조사)
(데이터 다운로드 날짜: 2021-12-16)
사업체 : 영리·비영리를 분문하고 개개의 상점, 사무소, 영업소, 은행, 학교 등과 같이 일정한 물리적 장소에서 재화의 생산·판매, 서비스 제공 등 경제활동을 독립적으로 수행하고 있는 모든 경영단위
[age 데이터 셋]
통계청 데이터: 산업분류 체계를 5레벨로 구성
제공하는 데이터: 산업분류 1레벨(대분류) 데이터까지 제공
[sex 데이터 셋]
통계청 데이터: 산업분류 체계를 5레벨로 구성
제공하는 데이터: 산업분류 1레벨(대분류) 데이터까지 제공
번호 | 칼럼 명 | 내용 |
---|---|---|
1 | year | 연도 |
2 | sgis_lv | 행정구역 분류체계 기준 (1:시도, 2:시군구, 3:읍면동) |
3 | sgis_cd | 행정구역 코드 (통계청 읍면동코드 7자리) |
4 | sgis_nm | 행정구역명 |
5 | sgis_si | 시도 단위 |
6 | sgis_gu | 시군구 단위 |
7 | sgis_dong | 읍면동 단위 |
8 | indst_ctg | 산업분류 카테고리 레벨 (전체, 대분류 ...) |
9 | indst_cd | 산업분류 코드 (통계청 원본 데이터 기준) |
10 | indst_nm | 산업분류명 (통계청 원본 데이터 기준) |
11 | key | 대표자 성별 구분 / 대표자 연령별 구분 (통계청 원본 데이터 기준) |
12 | key_cd | 대표자 성별 구분_ 조정 / 대표자 연령별 구분_ 조정 (key 필드 조정) |
13 | num_estbl | 사업체 수 |
14 | num_wrk | 종사자 수 |
[age 데이터 셋]
year | sgis_lv | sgis_cd | sgis_nm | sgis_si | sgis_gu | sgis_dong | indst_ctg | indst_cd | indst_nm | key | key_cd | num_estbl | num_wrk |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2012 | 1 | 11 | 서울특별시 | 서울특별시 | NULL | NULL | 대분류 | C | 제조업 (10 ~ 33) | 20세미만 | v_19 | 2 | X |
2019 | 2 | 11240 | 송파구 | 서울특별시 | 송파구 | NULL | 대분류 | H | 운수 및 창고업 (49 ~ 52) | 60세 이상 | v60_ | 2215 | 4967 |
[sex 데이터 셋]
ar | sgis_lv | sgis_cd | sgis_nm | sgis_si | sgis_gu | sgis_dong | indst_ctg | indst_cd | indst_nm | key | key_cd | num_estbl | num_wrk |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1997 | 1 | 11 | 서울특별시 | 서울특별시 | NULL | NULL | 대분류 | 0 | 전체 산업 | 계 | num_ew | 692616 | null |
2019 | 2 | 23010 | 중구 | 인천광역시 | 중구 | NULL | 대분류 | F | 건설업 (41-42) | 대표자남자 | M | 242 | 1113 |
통계청에서 제공한 데이터를 이용하여 시각화를 용이하게 하기위하여 산업분류 체계를 기준으로 산업분류 카테고리를 추가하였습니다.
전체(0레벨) - 대분류(1레벨) - 중분류(2레벨) - 소분류(3레벨) - 세분류(4레벨) - 세세분류(5레벨) 으로 구성되어 있습니다.
통계청에서 제공한 데이터의 항목이 연도에 따라 다를 수 있으므로, 시계열 분석을 위해 추가하여 작성하였습니다. 제공하는 데이터는 통계청 공개범위에 따라 항목이 다를 수 있습니다. ※ 해당 데이터를 이용하시는 분께서 본 프로젝트를 위해 조정한 항목이 아닌 원본 항복을 이용하여 분석 하실수 있도록 원본 항목(key)을 같이 제공합니다.
[age 데이터 셋]
번호 | 구분 코드 | 원본데이터 명 | 비고 |
---|---|---|---|
1 | v_19 | 20세미만 | |
2 | v20_29 | 20-29세 | |
3 | v30_39 | 30-39세 | |
4 | v40_49 | 40-49세 | |
5 | v50_59 | 50-59세 | |
6 | v60_ | 60세 이상 |
[sex 데이터 셋]
번호 | 구분 코드 | 원본데이터 명 | 비고 |
---|---|---|---|
1 | M | 남, 대표자남자 | |
2 | F | 여, 대표자여자 | |
3 | num_ew | 계 | 1997-1999년에만 존재 |
이 프로젝트는 다음과 같은 파일들로 이루어져 있습니다.
차트에 사용된 raw data(.csv)
시각화 차트 작성을 위한 전체 R 소스코드(.R)
웹 표현을 위한 차트 별 HTML 코드(.html)
[사업체 대표자] - 서울시 사업체 대표자 연령대별 사업체 수 비율
[사업체 대표자] - 서울시 사업체 대표자 업종별 연령대별 사업체 수
[사업체 대표자] - 서울시 대표자 성별 비율
[사업체 대표자] - 서울시 사업체 대표자 업종별 성별 사업체 수
R version 4.1.1 (2021-08-10)
패키지 버전
최초작성: 행정안전부 2021년 공공빅데이터 청년인턴 강지영 오혜린 (서울연구원) 최종수정일자: 2022-02-23