여러 테이블의 결합을 통한 검색 (JOIN 검색)

Join은 여러 테이블에 저장된 데이터를 하나의 SQL 문으로 한번에 검색할 수 있는 기능
이 조인기능은 현재 관계 DBMS를 사실상 표준으로 만드는데 결정적인 역할
두 개 이상의 테이블을 조인하기 위해서는 왜래키(foreign key)가 적어도 하나 이상 있어야 함

[MySQL JOIN의 종류]

아래의 두개의 테이블 (예제)
- t1 table
- +------+------+ | i1 | c1 | +------+------+ | 1 | a | | 2 | b | | 3 | c | +------+------+
- t2 table
- +------+------+ | i2 | c2 | +------+------+ | 2 | c | | 3 | b | | 4 | a | +------+------+
INNER JOIN (내부조인): t1 table의 i1과 t2 table의 i2가 같은 레코드를 생성

mysql> SELECT t1.*, t2.* FROM t1 INNER JOIN t2 ON t1.i1 = t2.i2;
+------+------+------+------+
| i1   | c1   | i2   | c2   |
+------+------+------+------+
|    2 | b    |    2 | c    |
|    3 | c    |    3 | b    |
+------+------+------+------+

OUTER JOIN (외부조인)

LEFT JOIN

SELECT t1.*, t2.* FROM t1 LEFT JOIN t2 ON t1.i1 = t2.i2;

+------+------+------+------+
| i1   | c1   | i2   | c2   |
+------+------+------+------+
|    2 | b    |    2 | c    |
|    3 | c    |    3 | b    |
|    1 | a    | NULL | NULL |
+------+------+------+------+

RIGHT JOIN

SELECT t1.*, t2.* FROM t1 RIGHT JOIN t2 ON t1.i1 = t2.i2;

+------+------+------+------+
| i1   | c1   | i2   | c2   |
+------+------+------+------+
|    2 | b    |    2 | c    |
|    3 | c    |    3 | b    |
| NULL | NULL |    4 | a    |
+------+------+------+------+

FULL JOIN ??? : MySQL에서는 LEFT JOIN + RIGHT JOIN의 결과를 합하여 (UNION) 생성

# SELECT t1.*, t2.* FROM t1 FULL OUTER JOIN t2 ON t1.i1 = t2.i2; # ERROR in MySQL
SELECT t1.*, t2.* FROM t1 LEFT JOIN t2 ON t1.i1 = t2.i2 UNION ALL SELECT t1.*, t2.* FROM t1 RIGHT JOIN t2 ON t1.i1 = t2.i2;

+------+------+------+------+
| i1   | c1   | i2   | c2   |
+------+------+------+------+
|    2 | b    |    2 | c    |
|    3 | c    |    3 | b    |
|    1 | a    | NULL | NULL |
|    2 | b    |    2 | c    |
|    3 | c    |    3 | b    |
| NULL | NULL |    4 | a    |
+------+------+------+------+


mysql> (SELECT * FROM t1 JOIN t2 ON t1.i1 = t2.i2) UNION (SELECT * FROM t1 RIGHT JOIN t2 ON t1.i1 = t2.i2);
+------+------+------+------+
| i1   | c1   | i2   | c2   |
+------+------+------+------+
|    2 | b    |    2 | c    |
|    3 | c    |    3 | b    |
| NULL | NULL |    4 | a    |
+------+------+------+------+

CROSS JOIN (크로스조인): 두 테이블의 곱 (Catesian product, Cross product)

아래의 SQL을 실행하고 위의 결과와 비교하라.

SELECT * FROM t1 JOIN t2;
SELECT * FROM t1, t2;

SELF JOIN (자기 자신과의 CROSS JOIN)

mysql> SELECT * FROM t1 AS a CROSS JOIN t1 AS b;

+------+------+------+------+
| i1   | c1   | i1   | c1   |
+------+------+------+------+
|    1 | a    |    1 | a    |
|    2 | b    |    1 | a    |
|    3 | c    |    1 | a    |
|    1 | a    |    2 | b    |
|    2 | b    |    2 | b    |
|    3 | c    |    2 | b    |
|    1 | a    |    3 | c    |
|    2 | b    |    3 | c    |
|    3 | c    |    3 | c    |
+------+------+------+------+

mysql> SELECT * FROM t1 CROSS JOIN t2;
+------+------+------+------+
| i1   | c1   | i2   | c2   |
+------+------+------+------+
|    1 | a    |    2 | c    |
|    2 | b    |    2 | c    |
|    3 | c    |    2 | c    |
|    1 | a    |    3 | b    |
|    2 | b    |    3 | b    |
|    3 | c    |    3 | b    |
|    1 | a    |    4 | a    |
|    2 | b    |    4 | a    |
|    3 | c    |    4 | a    |
+------+------+------+------+
9 rows in set (0.00 sec)

다음의 SQL문을 수행해 보고 위의 결과와 비교해 보시오.

SELECT t1.*, t2.* FROM t1 JOIN t2 WHERE t1.i1=t2.i2;
SELECT t1.*, t2.* FROM t1 JOIN t2 ON t1.i1=t2.i2;
SELECT t1.*, t2.* FROM t1 CROSS JOIN t2 WHERE t1.i1=t2.i2;
SELECT t1.*, t2.* FROM t1 CROSS JOIN t2 ON t1.i1=t2.i2;

[JOIN v.s. data.table]

JOIN typeDT syntaxdata.table::merge() syntax

INNER	X[Y, nomatch=0]	merge(X, Y, all=FALSE)
LEFT	Y[X]	merge(X, Y, all.x=TRUE)
RIGHT	X[Y]	merge(X, Y, all.y=TRUE)
OUTER	-	merge(X, Y, all=TRUE)

[Join 검색문을 작성하는 순서]

SELECT 절에서 검색하고 하는 열 이름들을 명시
FROM 절에서 SELECT 절에 지정된 열 이름들의 소속 테이블 이름을 명시
FROM 절에 지정된 테이블 이름이 두 개 이상이면, WHERE 절에 조인 조건절을 명시

참고
- 두개 이상의 테이블에서 열이름이 중복을 해결하기 위해서 테이블이름과 열이름을 반드시 점(.)으로 구분
  - 예) 두 테이블에 동일 컬럼명 id: 조인문에서는 professor.id와 student.id를 사용
- 테이블 이름을 AS문을 이용하여 다른 이름으로 변경 가능
  - FROM 절에서 테이블 이름에 별명을 지정한 후, 조인 조건절(where)에서 지정된 별명을 사용

[예제]

아래의 테이블 정보를 이용하여 테이블을 만들어라.
- [my_db_name].code
- +---------+-------------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | +---------+-------------+------+-----+---------+-------+ | newcode | char(2) | NO | PRI | NULL | | | oldcode | char(2) | NO | | NULL | | | name | varchar(20) | NO | | NULL | | +---------+-------------+------+-----+---------+-------+
- [my_db_name].pop
- +---------+---------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | +---------+---------+------+-----+---------+-------+ | newcode | char(2) | NO | PRI | NULL | | | sex | char(3) | NO | PRI | NULL | | | year | int(11) | NO | PRI | NULL | | | pop | int(11) | YES | | NULL | | +---------+---------+------+-----+---------+-------+
- [my_db_name].income
- +-----------+-------------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | +-----------+-------------+------+-----+---------+-------+ | oldcode | char(2) | NO | PRI | NULL | | | statistic | varchar(20) | NO | PRI | NULL | | | value | int(11) | YES | | NULL | | +-----------+-------------+------+-----+---------+-------+
SQL구문

#DROP TABLE jskim.code;
CREATE TABLE jskim.code(
newcode CHAR(2) NOT NULL PRIMARY KEY,
oldcode CHAR(2) NOT NULL,
name varchar(20) NOT NULL
) DEFAULT CHARACTER SET utf8 
  DEFAULT COLLATE utf8_general_ci;

#DROP TABLE jskim.pop;
CREATE TABLE jskim.pop (
newcode CHAR(2) NOT NULL, # newcode
sex CHAR(3) NOT NULL,
year INT NOT NULL,
pop  INT,
PRIMARY KEY(newcode,sex,year)
) DEFAULT CHARACTER SET utf8 
  DEFAULT COLLATE utf8_general_ci;

#DROP TABLE jskim.income;
CREATE TABLE jskim.income (
oldcode CHAR(2) NOT NULL, # oldcode
statistic VARCHAR(20) NOT NULL,
value INT,
PRIMARY KEY(oldcode,statistic)
) DEFAULT CHARACTER SET utf8 
  DEFAULT COLLATE utf8_general_ci;

아래의 자료는 자료값이 탭으로 구분된 자료이고 첫번째 라인은 변수명이다. 위에서 생성한 테이블에 각각 입력하여라.

SQL

code

LOAD DATA LOCAL INFILE "~/lectures2/DB/data/code.txt"
  INTO TABLE jskim.code 
  CHARACTER SET utf8 
    FIELDS TERMINATED BY '\t'
    LINES TERMINATED BY '\n'
    IGNORE 1 LINES;

LOAD DATA LOCAL INFILE '~/lectures2/DB/data/pop.txt' 
    INTO TABLE jskim.pop 
    CHARACTER SET utf8 
    FIELDS TERMINATED BY '\t'
    LINES TERMINATED BY '\n'
    IGNORE 1 LINES;

LOAD DATA LOCAL INFILE "~/lectures2/DB/data/income.txt" 
    INTO TABLE jskim.income 
    CHARACTER SET utf8 
    FIELDS TERMINATED BY '\t'
    LINES TERMINATED BY '\n'
    IGNORE 1 LINES;

code테이블의 newcode와 pop테이블의 newcode를 이용하여 두 테이블을 JOIN

SELECT A.newcode, A.oldcode, A.name, B.sex, B.year, B.pop 
  FROM jskim.code as A RIGHT JOIN jskim.pop as B 
  ON A.newcode=B.newcode;

# 뷰(view)의 생성: ----------------------------------------------------------------
#  DROP VIEW jskim.P1;
CREATE VIEW jskim.P1 AS SELECT A.newcode, A.oldcode, A.name, B.pop 
  FROM jskim.code as A RIGHT JOIN jskim.pop as B 
  ON A.newcode=B.newcode
  WHERE year=2017 AND sex='전체';

SELECT * FROM jskim.P1;

# 뷰(view)의 생성: ----------------------------------------------------------------
#  DROP VIEW jskim.I1;
CREATE VIEW jskim.I1 AS SELECT oldcode, value as GRDP 
  FROM jskim.income
  WHERE statistic='GRDP';
  SELECT * FROM jskim.I1;


# 두개의 뷰(view)를 조인: ----------------------------------------------------------------
SELECT newcode, name, pop, GRDP 
  FROM jskim.P1 AS A JOIN jskim.I1 AS B 
  ON A.oldcode=B.oldcode;

DROP VIEW jskim.P1;

SELECT B.newcode, B.name, A.statistic, A.value 
  FROM jskim.income as A JOIN jskim.code as B 
  ON A.code=B.oldcode;

아래의 문제를 풀기 위한 SQL을 작성하시오.

시도별 2017년 전체 인구수
시도별 2011년 전체 인구수
위의 두개의 결과를 join한 후 시도별 2011년 대비 2017년 전체 인구 증가율

CREATE VIEW P2017 AS SELECT A.name, A.newcode, B.pop 
FROM jskim.code AS A JOIN jskim.pop AS B 
ON A.newcode = B.newcode WHERE B.sex = "전체" AND B.year=2017 AND A.name != "전국";

CREATE VIEW P2011 AS SELECT A.name, A.newcode, B.pop 
FROM jskim.code AS A join jskim.pop AS B 
ON A.newcode = B.newcode WHERE B.sex = "전체" AND B.year=2011 AND A.name != "전국";

SELECT P1.name AS 시도명, P1.pop AS '2017년인구', 
P2.pop AS '2011년인구', 
P1.pop/P2.pop AS '인구증가율(%)'
FROM jskim.P2017 AS P1 JOIN jskim.P2011 AS P2 ON P1.newcode = P2.newcode;

+-----------------------+---------------+---------------+--------------------+
| 시도명                | 2017년인구    | 2011년인구    | 인구증가율(%)      |
+-----------------------+---------------+---------------+--------------------+
| 서울특별시            |       9857426 |      10249679 |                 96 |
| 부산광역시            |       3470653 |       3550963 |                 98 |
| 대구광역시            |       2475231 |       2507271 |                 99 |
| 인천광역시            |       2948542 |       2801274 |                105 |
| 광주광역시            |       1463770 |       1463464 |                100 |
| 대전광역시            |       1502227 |       1515603 |                 99 |
| 울산광역시            |       1165132 |       1135494 |                103 |
| 세종특별자치시        |        280100 |          NULL |               NULL |
| 경기도                |      12873895 |      11937415 |                108 |
| 강원도                |       1550142 |       1536448 |                101 |
| 충청북도              |       1594432 |       1562903 |                102 |
| 충청남도              |       2116770 |       2101284 |                101 |
| 전라북도              |       1854607 |       1874031 |                 99 |
| 전라남도              |       1896424 |       1914339 |                 99 |
| 경상북도              |       2691706 |       2699195 |                100 |
| 경상남도              |       3380404 |       3308765 |                102 |
| 제주특별자치도        |        657083 |        576156 |                114 |
+-----------------------+---------------+---------------+--------------------+

아래의 문제를 풀기 위한 SQL을 작성하시오.
1. 시도별 개인소득
2. 시도별 개인소비
3. 위의 두개의 결과를 join한 후 시도별 개인 소득 대비 개인소비 비율
4. 시도별 GRDP, 2017년 인구수, 일인당 소득(GRDP/인구수)

저작자표시 비영리 변경금지 (새창열림)

'SQL' 카테고리의 다른 글

MySQL) create table & mul index (0)	2022.06.09
MySQL) 컬럼(column) 추가 (0)	2022.06.05
MySQL) 백업, 복원 (DB, Table 백업, 복원) 데이터 옮기기 (0)	2022.04.02
MySQL) user(계정) 생성, 로그인, 변경, 삭제 (0)	2022.03.20
MySQL) 페이징 처리를 위한 query문 COUNTORDERS, OFFSET, LIMIT (0)	2022.03.20

여러 테이블의 결합을 통한 검색 (JOIN 검색)

[MySQL JOIN의 종류]

[JOIN v.s. data.table]

[Join 검색문을 작성하는 순서]

[예제]

'SQL' 카테고리의 다른 글

티스토리툴바