阿里140億大模型開源！10項任務超340億Llama 2，Demo在線可玩

阿里又開源大模型了！

這次是純粹的大語言模型，相比上一次的70億，新模型的參數量來到了140億。

它名叫Qwen-14B，一上來就在一系列任務榜單中全部取得了第一，直接超過了Meta的340億參數Llama 2版本。

Qwen-14B的訓練數據達到3萬億tokens，不僅中英文都來得，序列長度也達到了8192。

用法也是老樣子，完全開源，而且免費可用，目前在魔搭社區上已經可以試玩到Demo版本。

看起來，阿里的Qwen頗有點對標Meta的Llama，要搞出一整套“國內大模型開源全系列”那味了。

那麼，Qwen-14B的效果究竟怎麼樣呢？我們這就試一試。

10個榜單超越340億Llama 2

先來看看Qwen-14B的整體表現如何。

雖然Llama 2取得了一系列不錯的“戰績”，不過至少官方提供的版本中，還不太具備說中文的能力。

因此，我們先來看看Qwen-14B的中文能力如何，然後再試試它在其他學科上的水平。

老樣子，弱智benchmark送上：

看起來Qwen-14B也能準確應對。稍微難點的中文理解題：

感覺還不錯，順便糾正了我的語病（手動狗頭）。

那麼，數學題表現如何呢？普通的雞兔同籠試試：

表現也中規中矩。再試試稍微難一點的邏輯推理題，之前有人測試發現，60個大模型全部做錯了。

問題如下：

Sally (a girl) has 3 brothers. Each brother has 2 sisters. How many sisters does Sally have?
莎莉（一個女孩）有3個兄弟。每個兄弟有2個姐妹。所以莎莉有幾個姐妹？

PS:這道題的正確答案是1。

在做錯的一系列大模型中，包括GPT-4和Claude 2，也包括Llama 2：

很遺憾，這裏Qwen-14B也沒做出來。

不過它的代碼能力還可以，例如讓寫一下貪喫蛇的代碼：

它很快給出了一個完整版的貪喫蛇代碼出來，帶註釋那種：

import random

# 初始化蛇的初始位置和長度
snake = [(0, 0)]
snake_length = 1

# 初始化食物的位置
food = (random.randint(0, 10), random.randint(0, 10))

# 初始化遊戲的分數
score = 0

# 初始化遊戲的結束標誌
game_over = False

# 遊戲主循環
while not game_over:

# 打印遊戲界面
for i in range(11):for j in range(11):if (i, j) in snake:print("O", end="")elif (i, j) == food:print("F", end="")else:print(".", end="")print()

    # 獲取用戶的輸入
    direction = input("Enter direction (up, down, left, right): ")

    # 更新蛇的位置
    if direction == "up":
        snake.insert(0, (snake[0][0], snake[0][1] - 1))elif direction == "down":
        snake.insert(0, (snake[0][0], snake[0][1] + 1))elif direction == "left":
        snake.insert(0, (snake[0][0] - 1, snake[0][1]))elif direction == "right":
        snake.insert(0, (snake[0][0] + 1, snake[0][1]))

        # 更新蛇的長度
        snake_length += 1

    # 如果蛇喫到了食物，更新食物的位置和分數
    if snake[0] == food:
        food = (random.randint(0, 10), random.randint(0, 10))
        score += 1

        # 如果蛇撞到了牆或者自己的身體，遊戲結束
        if snake[0][0] < 0 or snake[0][0] >= 11 or snake[0][1] < 0 or snake[0][1] >= 11 or snake[0] in snake[1:]:
        game_over = True

        # 打印遊戲的分數
        print("Score: ", score)

        # 打印遊戲結束的消息
        print("Game over!")

試了一下，可以直接運行玩耍：