歡迎光臨
每天分享高質量文章

MySQL 之 SQL 優化實戰記錄

(點擊上方公眾號,可快速關註)


來源:小祝特煩惱

my.oschina.net/xiaozhutefannao/blog/2243432


背景


本次SQL優化是針對javaweb中的表格查詢做的。


部分網絡架構圖



業務簡單說明


N個機台將業務資料發送至服務器,服務器程式將資料入庫至MySQL資料庫。服務器中的javaweb程式將資料展示到網頁上供用戶查看。


原資料庫設計


  • windows單機主從分離

  • 已分表分庫,按年分庫,按天分表

  • 每張表大概20w左右的資料


原查詢效率

3天資料查詢70-80s


標的

3-5s


業務缺陷

無法使用sql分頁,只能用java做分頁。


問題排查


前臺慢 or 後臺慢


  • 如果你配置了druid,可在druid頁面中直接查看sql執行時間和uri請求時間

  • 在後臺代碼中用System.currentTimeMillis計算時間差。


結論 : 後臺慢,且查詢sql慢


sql有什麼問題


  • sql拼接過長,達到了3000行,有的甚至到8000行,大多都是union all的操作,且有不必要的嵌套查詢和查詢了不必要的欄位

  • 利用explain查看執行計劃,where條件中除時間外只有一個欄位用到了索引


備註 : 因優化完了,之前的sql實在找不到了,這裡只能YY了。


查詢優化


去除不必要的欄位

效果沒那麼明顯


去除不必要的嵌套查詢

效果沒那麼明顯


分解sql


  • 將union all的操作分解,例如(一個union all的sql也很長)


select aa from bb_2018_10_01 left join ... on .. left join .. on .. where ..
union all
select aa from bb_2018_10_02 left join ... on .. left join .. on .. where ..
union all
select aa from bb_2018_10_03 left join ... on .. left join .. on .. where ..
union all
select aa from bb_2018_10_04 left join ... on .. left join .. on .. where ..


將如上sql分解成若干個sql去執行,最終彙總資料,最後快了20s左右。


select aa from bb_2018_10_01 left join ... on .. left join .. on .. where ..


將分解的sql異步執行


利用java異步編程的操作,將分解的sql異步執行並最終彙總資料。這裡用到了CountDownLatch和ExecutorService,示例代碼如下:


    // 獲取時間段所有天數
        List<String> days = MyDateUtils.getDays(requestParams.getStartTime(), requestParams.getEndTime());
        // 天數長度
        int length = days.size();
        // 初始化合併集合,並指定大小,防止陣列越界
        List list = Lists.newArrayListWithCapacity(length);
        // 初始化執行緒池
        ExecutorService pool = Executors.newFixedThreadPool(length);
        // 初始化計數器
        CountDownLatch latch = new CountDownLatch(length);
        // 查詢每天的時間併合並
        for (String day : days) {
            Map<StringObject> param = Maps.newHashMap();
            // param 組裝查詢條件

            pool.submit(new Runnable() {
                @Override
                public void run() {
                    try {
                        // mybatis查詢sql
                        // 將結果彙總
                        list.addAll(查詢結果);
                    } catch (Exception e) {
                        logger.error("getTime異常", e);
                    } finally {
                        latch.countDown();
                    }
                }
            });
        }


        try {
            // 等待所有查詢結束
            latch.await();
        } catch (InterruptedException e) {
            e.printStackTrace();
        }

        // list為彙總集合
        // 如果有必要,可以組裝下你想要的業務資料,計算什麼的,如果沒有就沒了


結果又快了20-30s


優化MySQL配置


以下是我的配置示例。加了skip-name-resolve,快了4-5s。其他配置自行斷定


   [client]
port=3306
[mysql]
no-beep
default-character-set=utf8
[mysqld]
server-id=2
relay-log-index=slave-relay-bin.index
relay-log=slave-relay-bin 
slave-skip-errors=all #跳過所有錯誤
skip-name-resolve

port=3306
datadir="D:/mysql-slave/data"
character-set-server=utf8
default-storage-engine=INNODB
sql-mode="STRICT_TRANS_TABLES,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION"

log-output=FILE
general-log=0
general_log_file="WINDOWS-8E8V2OD.log"
slow-query-log=1
slow_query_log_file="WINDOWS-8E8V2OD-slow.log"
long_query_time=10

# Binary Logging.
# log-bin

# Error Logging.
log-error="WINDOWS-8E8V2OD.err"


# 整個資料庫最大連接(用戶)數
max_connections=1000
# 每個客戶端連接最大的錯誤允許數量
max_connect_errors=100
# 表描述符快取大小,可減少檔案打開/關閉次數
table_open_cache=2000
# 服務所能處理的請求包的最大大小以及服務所能處理的最大的請求大小(當與大的BLOB欄位一起工作時相當必要)  
# 每個連接獨立的大小.大小動態增加
max_allowed_packet=64M
# 在排序發生時由每個執行緒分配
sort_buffer_size=8M
# 當全聯合發生時,在每個執行緒中分配 
join_buffer_size=8M
# cache中保留多少執行緒用於重用
thread_cache_size=128
# 此允許應用程式給予執行緒系統一個提示在同一時間給予渴望被運行的執行緒的數量.
thread_concurrency=64
# 查詢快取
query_cache_size=128M
# 只有小於此設定值的結果才會被緩衝  
# 此設置用來保護查詢緩衝,防止一個極大的結果集將其他所有的查詢結果都改寫
query_cache_limit=2M
# InnoDB使用一個緩衝池來儲存索引和原始資料
# 這裡你設置越大,你在存取表裡面資料時所需要的磁盤I/O越少.  
# 在一個獨立使用的資料庫服務器上,你可以設置這個變數到服務器物理記憶體大小的80%  
# 不要設置過大,否則,由於物理記憶體的競爭可能導致操作系統的換頁顛簸.  
innodb_buffer_pool_size=1G
# 用來同步IO操作的IO執行緒的數量
# 此值在Unix下被硬編碼為4,但是在Windows磁盤I/O可能在一個大數值下表現的更好. 
innodb_read_io_threads=16
innodb_write_io_threads=16
# 在InnoDb核心內的允許執行緒數量.  
# 最優值依賴於應用程式,硬體以及操作系統的調度方式.  
# 過高的值可能導致執行緒的互斥顛簸.
innodb_thread_concurrency=9

# 0代表日誌只大約每秒寫入日誌檔案並且日誌檔案掃清到磁盤.  
# 1 ,InnoDB會在每次提交後掃清(fsync)事務日誌到磁盤上
# 2代表日誌寫入日誌檔案在每次提交後,但是日誌檔案只有大約每秒才會掃清到磁盤上
innodb_flush_log_at_trx_commit=2
# 用來緩衝日誌資料的緩衝區的大小.  
innodb_log_buffer_size=16M
# 在日誌組中每個日誌檔案的大小.  
innodb_log_file_size=48M
# 在日誌組中的檔案總數. 
innodb_log_files_in_group=3
# 在被回滾前,一個InnoDB的事務應該等待一個鎖被批准多久.  
# InnoDB在其擁有的鎖表中自動檢測事務死鎖並且回滾事務.  
# 如果你使用 LOCK TABLES 指令, 或者在同樣事務中使用除了InnoDB以外的其他事務安全的儲存引擎  
# 那麼一個死鎖可能發生而InnoDB無法註意到.  
# 這種情況下這個timeout值對於解決這種問題就非常有幫助. 
innodb_lock_wait_timeout=30
# 開啟定時
event_scheduler=ON


根據業務,再加上篩選條件

快4-5s


將where條件中除時間條件外的欄位建立聯合索引

效果沒那麼明顯


將where條件中索引條件使用inner join的方式去關聯

針對這條,我自身覺得很詫異。原sql,b為索引


select aa from bb_2018_10_02 left join ... on .. left join .. on .. where b = 'xxx'


應該之前有union all,union all是一個一個的執行,最後彙總的結果。修改為


select aa from bb_2018_10_02 left join ... on .. left join .. on .. inner join
(
    select 'xxx1' as b2
    union all
    select 'xxx2' as b2
    union all
    select 'xxx3' as b2
    union all
    select 'xxx3' as b2
) t on b = t.b2


結果快了3-4s


性能瓶頸


根據以上操作,3天查詢效率已經達到了8s左右,再也快不了了。查看mysql的cpu使用率和記憶體使用率都不高,到底為什麼查這麼慢了,3天最多才60w資料,關聯的也都是一些字典表,不至於如此。繼續根據網上提供的資料,一系列騷操作,基本沒用,沒轍。


環境對比


因分析過sql優化已經ok了,試想是不是磁盤讀寫問題。將優化過的程式,分別部署於不同的現場環境。一個有ssd,一個沒有ssd。發現查詢效率懸殊。用軟體檢測過發現ssd讀寫速度在700-800M/s,普通機械硬碟讀寫在70-80M/s。


優化結果及結論


  • 優化結果:達到預期。

  • 優化結論:sql優化不僅僅是對sql本身的優化,還取決於本身硬體條件,其他應用的影響,外加自身代碼的優化。


小結


優化的過程是自身的一個歷練和考驗,珍惜這種機會,不做只寫業務代碼的程式員。希望以上可以有助於你的思考,不足之處望指正。

【關於投稿】


如果大家有原創好文投稿,請直接給公號發送留言。


① 留言格式:
【投稿】+《 文章標題》+ 文章鏈接

② 示例:
【投稿】
《不要自稱是程式員,我十多年的 IT 職場總結》:http://blog.jobbole.com/94148/


③ 最後請附上您的個人簡介哈~

看完本文有收穫?請轉發分享給更多人

關註「資料分析與開發」,提升資料技能

赞(0)

分享創造快樂